Claude 3.7 Sonnet не зміг виграти в Pokémon за місяць

Компанія Anthropic в рамках тестування штучного інтелекту запустила ініціативу Claude Plays Pokémon, в рамках якої їхня новітня модель, Claude 3.7 Sonnet, намагається керувати персонажем у класичній грі для Game Boy. Проте, за понад місяць спроб, ШІ так і не змогло «перемогти» покемонів, повідомляють експерти сайту ArsTechnica.

Про це розповідає Finway

Хоча розробники заявляють, що нова модель демонструє покращені навички планування, запам’ятовування цілей і адаптації до змін у грі, Claude все ще стикається з низкою труднощів. ШІ може застрягати в глухих кутах, невдало взаємодіяти з ігровими персонажами (NPC) або повторювати одні й ті самі помилки.

Виклики в сприйнятті візуальної інформації

Однією з головних проблем для Claude 3.7 Sonnet є сприйняття візуальної інформації. Модель використовує текстові дані гри та зчитує інформацію безпосередньо з пам’яті, проте її можливості інтерпретації піксельних зображень залишаються обмеженими. За словами розробника проєкту Девіда Херші, ШІ значно легше розпізнавало б елементи з більш реалістичною графікою.

Крім того, навігація в грі є ще одним викликом. Claude не завжди усвідомлює, що деякі будівлі непрохідні, і може годинами намагатися пройти через стіну.

Обмеження пам’яті та самокорекція

Проблема пам’яті також викликає складнощі. Контекстне вікно моделі має обмеження в 200 000 токенів, і коли воно заповнюється, ШІ намагається підсумувати накопичені знання, що іноді призводить до втрати важливих деталей. Якщо модель робить помилку, вона може застрягти на невірних даних, вважаючи, наприклад, що вихід з локації знаходиться не там, де є насправді.

Однак останні версії Claude вже демонструють елементи самокорекції, що є важливим кроком для подальшого розвитку штучного інтелекту. Розробники вважають, що розширення контексту та покращення обробки зображень можуть допомогти моделі наблизитися до успішного проходження гри.

Наразі експеримент показує, що навіть передові мовні моделі, попри досягнення в аналізі текстової інформації та плануванні, все ще стикаються з основними обмеженнями під час взаємодії зі світом, що віддаляє їх від справжнього штучного загального інтелекту (AGI).

Нагадаємо, ми писали, що ШІ дав змогу паралізованому пацієнтові керувати роборукою за допомогою сили думки.