Claude Opus 4.8: нові функції та покращення AI

Anthropic офіційно представила Claude Opus 4.8 — оновлену версію своєї флагманської штучної інтелектуальної моделі. Розробники підкреслюють, що вона стала точнішою у виявленні та визнанні власних помилок під час написання коду, а також досягла вищих результатів у ключових бенчмарках порівняно з попередниками.

Про це розповідає Finway

Нові можливості та результати тестувань

Claude Opus 4.8 замінила версію 4.7, яка з’явилася у квітні 2026 року. За інформацією компанії, новинка демонструє підвищену швидкість і ефективність у різноманітних тестах, а також зберігає попередню цінову політику — $5 за 1 млн вхідних токенів і $25 за 1 млн вихідних.

Оцінка Claude Opus 4.8 за ключовими тестами. Джерело: Anthropic.

У бенчмарку SWE-Bench Pro, який оцінює здатність ШІ виправляти реальні помилки в коді, Claude Opus 4.8 досягла 69,2% проти 64,3% у попередньої версії та 58,6% у OpenAI GPT-5.5. У тесті OSWorld, що аналізує виконання задач у межах операційних систем, результат склав 83,4%. В бенчмарку GDPval-AA модель отримала 1890 балів, перевершивши показник 1753 у версії 4.7. Проте у Terminal-Bench 2.1, який вимірює ефективність у термінальних середовищах, Opus 4.8 все ще поступається GPT-5.5.

У Humanity’s Last Exam (2500 запитань із різних наук) Claude Opus 4.8 отримала 49,8% без використання додаткових інструментів і 57,9% з ними, випередивши трьох основних конкурентів. Компанія Linkup відзначила, що ця модель вперше успішно пройшла всі кейси в межах Super-Agent benchmark, зберігаючи конкурентну ціну.

Однією з головних інновацій Anthropic вважає зростання чесності: модель у чотири рази рідше приховує помилки в коді і менше схильна до непідтверджених тверджень. Порівняно з Claude Mythos Preview, яка залишається недоступною для широкого загалу, Opus 4.8 не перевищує її в кібербезпеці, але наблизилася до лідируючих позицій у багатьох інших тестах.

«Ми протестували модель на наборі тестів із кібербезпеки, деякі з яких ми використали вперше в системній карті. Під час роботи без заходів безпеки Opus 4.8 демонструє дещо вищі можливості, ніж Claude Opus 4.7; із заходами безпеки його показники зіставні. Він і надалі суттєво відстає від Mythos Preview за кіберможливостями», — йдеться у звіті щодо моделі.

Щодо обговорення чутливих тем, модель зберігає попередній рівень, але тепер частіше визнає існування протилежних точок зору під час політичних дискусій. Водночас розробники помітили, що Claude Opus 4.8 стала «трохи менш задоволеною» своїм становищем порівняно з попередньою версією.

Впровадження нових функцій та плани Anthropic

З виходом Claude Opus 4.8 компанія запровадила низку нововведень. Найзначніше з них — Dynamic Workflows у Claude Code, що дозволяє використовувати субагентів для поділу завдань на дрібніші частини в межах однієї сесії, а результати перевіряються перед видачею. Функція доступна користувачам тарифних планів Enterprise, Team і Max.

Крім цього, з’явилася можливість вибору обсягу обчислень у селекторі моделі (від Low до Max, стандартно — High), що впливає на глибину відповідей і витрату токенів. Доступно для всіх тарифних планів. Режим Fast Mode став дешевшим майже втричі, забезпечуючи пришвидшене виконання запитів без втрати якості.

Користувачі тепер можуть уточнювати та доповнювати свої запити під час виконання завдань — Claude більше не зчитує весь контекст повторно. Також збільшено ліміти запитів у Claude Code, а найближчим часом очікується публічний реліз сімейства Mythos, яке раніше вважалося надто небезпечним для відкритого доступу.

Презентація Claude Opus 4.8 і анонс Mythos відбулися на тлі підготовки Anthropic до IPO. Компанія нещодавно уклала декілька партнерських угод для розширення обчислювальних потужностей. 28 травня 2026 року Anthropic оголосила про закриття інвестиційного раунду серії H із залученням $65 млрд за оцінки в $965 млрд — удвічі більше, ніж у лютому цього року, й вище підтвердженої оцінки OpenAI.

Залучені інвестиції будуть спрямовані на масштабування та зміцнення позицій Anthropic у сфері високопродуктивних обчислень. Вихід нової моделі, анонс Mythos та зростання оцінки компанії посилюють конкуренцію з OpenAI, хоча жодна зі сторін наразі не оприлюднила конкретних термінів проведення IPO.