Новый уровень программирования с GPT-5.5 от OpenAI

OpenAI объявила о запуске новой языковой модели GPT-5.5, которая, по словам компании, стала самой интеллектуальной и интуитивно понятной в своей линейке. Разработчики подчеркивают, что GPT-5.5 лучше понимает намерения пользователя и выполняет задачи с меньшим количеством токенов, что позволяет повысить эффективность в повседневной работе.

Об этом сообщает Finway

Расширенные возможности и интеграция инструментов

GPT-5.5 расширяет функциональные возможности для автоматизации задач: модель способна писать и отлаживать код, анализировать данные, создавать документы и управлять различными инструментами непосредственно из одного интерфейса. OpenAI считает этот релиз важным шагом к объединению ChatGPT, Codex и AI Browser в единый сервис — так называемый «суперапп», который позволит решать большинство рабочих задач в рамках единой экосистемы.

«Новая версия также приближает запуск “супераппа” — единого сервиса, который должен объединить ChatGPT, Codex и AI Browser. В OpenAI рассчитывают, что такая связка позволит закрывать все больше рабочих задач внутри одной экосистемы».

Модель уже доступна пользователям подписок Plus, Pro, Business и Enterprise в ChatGPT и Codex, а также в версии GPT-5.5 Pro для корпоративных подписок. Доступ к API обещают открыть в ближайшее время, базовая стоимость составит $5 за 1 млн входящих токенов и $30 за 1 млн исходящих, а для Pro-версии — $30 и $180 соответственно.

Впечатляющие результаты в программировании, науке и безопасности

Особое внимание в GPT-5.5 уделено программированию. В тестах Terminal-Bench 2.0 модель получила 82,7%, в SWE-Bench Pro — 58,6%. Внутренний бенчмарк Expert-SWE показал, что GPT-5.5 превосходит предыдущую версию GPT-5.4 в выполнении сложных инженерных задач с долгосрочным планированием, причем это достигнуто с меньшими затратами токенов.

В бенчмарке GDPval, который оценивает профессиональную интеллектуальную работу в 44 сферах, GPT-5.5 достигла 84,9%, а в OSWorld-Verified, который тестирует работу в реальных компьютерных средах, — 78,7%. В сложных сценариях клиентского обслуживания (Tau2-bench Telecom) модель показала 98% без необходимости дополнительной настройки. OpenAI также отмечает высокие результаты GPT-5.5 в финансовом анализе, моделировании и офисных задачах.

В научных тестах, таких как GeneBench, который оценивает анализ данных в генетике и количественной биологии, GPT-5.5 показала значительное увеличение по сравнению с предыдущей версией. В бенчмарке BixBench для биоинформатики модель достигла лучшего результата среди опубликованных систем. Компания считает, что GPT-5.5 уже способна ускорить реальные научные исследования.

OpenAI также уделила внимание безопасности: в GPT-5.5 усилен контроль над опасными запросами, добавлены новые классификаторы рисков и внедрены дополнительные меры против злоупотреблений. Эксперты компании оценивают уровень киберзащиты, а также безопасность в биологической и химической сферах как высокий.