OpenAI представила GPT-5.5: покращене програмування та крок до ШІ-супераппа

|
OpenAI представила GPT-5.5: покращене програмування та крок до ШІ-супераппа

OpenAI оголосила про запуск нової мовної моделі GPT-5.5, яка, за словами компанії, стала найінтелектуальнішою та найінтуїтивнішою у своїй лінійці. Розробники підкреслюють, що GPT-5.5 краще розуміє наміри користувача та виконує завдання з меншою кількістю токенів, що дозволяє підвищити ефективність у повсякденній роботі.

Про це розповідає Finway

Розширені можливості та інтеграція інструментів

GPT-5.5 розширює функціональні можливості для автоматизації завдань: модель здатна писати та налагоджувати код, аналізувати дані, створювати документи й управляти різними інструментами безпосередньо з одного інтерфейсу. OpenAI вважає цей реліз важливим кроком до об’єднання ChatGPT, Codex і AI Browser у єдиний сервіс — так званий «суперапп», який дозволить вирішувати більшість робочих задач у межах єдиної екосистеми.

«Нова версія також наближає запуск “супераппа” — єдиного сервісу, який має об’єднати ChatGPT, Codex і AI Browser. В OpenAI розраховують, що така зв’язка дасть змогу закривати дедалі більше робочих завдань усередині однієї екосистеми».

Модель уже доступна користувачам підписок Plus, Pro, Business і Enterprise у ChatGPT і Codex, а також у версії GPT-5.5 Pro для корпоративних підписок. Доступ до API обіцяють відкрити найближчим часом, базова вартість складе $5 за 1 млн вхідних токенів та $30 за 1 млн вихідних, а для Pro-версії — $30 і $180 відповідно.

Вражаючі результати у програмуванні, науці та безпеці

Особлива увага у GPT-5.5 приділена програмуванню. У тестах Terminal-Bench 2.0 модель отримала 82,7%, у SWE-Bench Pro — 58,6%. Внутрішній бенчмарк Expert-SWE показав, що GPT-5.5 перевершує попередню версію GPT-5.4 у виконанні складних інженерних завдань із довгостроковим плануванням, причому це досягнуто з меншими витратами токенів.

У бенчмарку GDPval, який оцінює професійну інтелектуальну роботу у 44 сферах, GPT-5.5 досягла 84,9%, а в OSWorld-Verified, що тестує роботу у реальних комп’ютерних середовищах, — 78,7%. У складних сценаріях клієнтського обслуговування (Tau2-bench Telecom) модель показала 98% без потреби додаткового налаштування. OpenAI також відзначає високі результати GPT-5.5 у фінансовому аналізі, моделюванні та офісних задачах.

У наукових тестах, таких як GeneBench, що оцінює аналіз даних у генетиці та кількісній біології, GPT-5.5 показала значне зростання в порівнянні з попередньою версією. У бенчмарку BixBench для біоінформатики модель здобула найкращий результат серед опублікованих систем. Компанія вважає, що GPT-5.5 вже здатна прискорити реальні наукові дослідження.

OpenAI також приділила увагу безпеці: у GPT-5.5 посилено контроль над небезпечними запитами, додано нові класифікатори ризиків і впроваджено додаткові заходи проти зловживань. Експерти компанії оцінюють рівень кіберзахисту, а також безпеку в біологічній і хімічній сферах як високий.