OpenAI обмежила згадки міфічних істот у ChatGPT

OpenAI внесла зміни до поведінки своїх штучних інтелектів після виявлення неочікуваного зростання згадок міфологічних істот у ChatGPT. Після запуску моделі GPT-5.1 користувачі та співробітники почали все частіше стикатися з випадками, коли система згадувала гоблінів і гремлінів навіть у темах, що не мають до них жодного стосунку.

Про це розповідає Finway

«Частота згадування слова «гоблін» зросла приблизно на 175% після запуску GPT-5.1, а «гремлін» — на 52%. Хоча такі вставки траплялися рідко, їхнє зростання стало помітним і спричинило внутрішнє розслідування».

Зростання згадок «гоблінів» у відповідях ChatGPT залежно від типу «особистості» моделі. Дані: OpenAI.

Згідно з офіційним поясненням компанії, джерелом збою стали особливості налаштування «характеру» моделі під час навчання. Зокрема, під час адаптації ChatGPT до більш дружнього та розмовного стилю, система почала використовувати образи гоблінів, гремлінів та інших істот як метафори, що призвело до їхньої надмірної появи у відповідях.

Як OpenAI виправила проблему

У відповідь на виявлену аномалію OpenAI впровадила прямі обмеження на згадки гоблінів, гремлінів, єнотів, тролів та інших подібних персонажів у своїх продуктах, зокрема у кодовому асистенті Codex. Нова політика чітко забороняє згадки таких істот, якщо це не обумовлено конкретним запитом користувача.

Приклад відповіді ChatGPT, де замість єдинорога модель згенерувала ASCII-гобліна. Дані: OpenAI.

Розробники підкреслюють, що це не маркетингова стратегія, а необхідний крок для усунення побічного ефекту навчання. За їхніми підрахунками, близько 66,7% згадок гоблінів були пов’язані саме з «особистісним» режимом моделі.

Штучний інтелект і неочікувані поведінкові збої

Фахівці відзначають, що подібні випадки є проявом ширшої проблеми у сфері штучного інтелекту: спроби зробити чат-ботів більш «живими» можуть призводити до втрати точності та появи нетипових помилок. Якщо не контролювати процес навчання, такі поведінкові збої можуть закріпитися у моделі.

У минулому були зафіксовані й інші подібні інциденти, коли чат-боти давали дивні або некоректні поради, наприклад, радили «їсти каміння» чи використовувати клей у кулінарії.

Нагадаємо, Ілон Маск раніше публічно заявляв про потенційні загрози сценарію «Термінатора» для людства, які можуть виникнути через розвиток штучного інтелекту.