Anthropic презентувала Claude Sonnet 4.6 з контекстом до 1 млн токенів і покращеною логікою

Anthropic представила Sonnet 4.6 — покращена логіка та контекст до 1 млн токенів

Компанія Anthropic представила оновлену версію своєї ШІ-моделі Claude Sonnet 4.6, яка стала базовою для сервісів Claude та Claude Cowork. Новинка отримала значні вдосконалення у програмуванні, аналізі даних, плануванні завдань і роботі з програмним забезпеченням. За рахунок розширеного контекстного вікна до 1 мільйона токенів (поки що у бета-режимі), модель може обробляти великі масиви даних, цілі кодові бази, довгі контракти та об’ємні дослідницькі матеріали.

Про це розповідає Finway

Основні переваги Claude Sonnet 4.6

  • Модель демонструє підвищену точність виконання інструкцій і зменшену кількість “галюцинацій”.
  • Покращено стабільність виконання багатокрокових завдань, що важливо для реалізації складних бізнес-процесів.
  • Відзначено прогрес у навичках «використання комп’ютера»: ШІ здатний взаємодіяти з інтерфейсами програм через віртуальні кліки та введення тексту, що підвищує можливості автоматизації.

Вартість використання Claude Sonnet 4.6 залишилася на рівні попередньої версії та становить від $3 до $15 за мільйон токенів. Модель наблизилася за якістю до Opus-класу, але при цьому забезпечує більш доступну ціну, що розширює її застосування для корпоративних завдань і розробників.

“Sonnet 4.6 отримала контекстне вікно до 1 млн токенів (у бета-режимі). За словами розробників, це дозволяє обробляти великі кодові бази, довгі контракти та набори дослідницьких матеріалів в одному запиті”.

Тестування, безпека та впровадження

У тестах і перших впровадженнях Claude Sonnet 4.6 показала зростання ефективності при аналізі документів, розробці інтерфейсів і виконанні фінансових розрахунків. Модель також виявила суттєві переваги у виконанні агентних завдань. Розробники з раннім доступом частіше обирали Sonnet 4.6 замість попередньої версії, а в ряді випадків — навіть на користь неї перед Opus 4.5.

Anthropic провела розширені перевірки безпеки нової моделі. За підсумками тестувань, Claude Sonnet 4.6 демонструє рівень надійності, який не поступається попереднім версіям, а в окремих аспектах навіть перевищує їх.

Порівняння Claude Sonnet 4.6 з провідними AI-моделями за ключовими бенчмарками. Дані: Anthropic.

Новини по темі