ИИ от Anthropic для поиска уязвимостей смарт-контрактов

Компания Anthropic презентовала результаты масштабного исследования по использованию современных моделей искусственного интеллекта для поиска уязвимостей в смарт-контрактах. Во время тестирования были задействованы модели Claude Sonnet 4.5, Claude Opus 4.5 и GPT-5, которые проверяли надежность контрактов на основе набора SCONE-bench. Этот набор содержал баги и эксплойты в контрактах Ethereum и BNB Chain, появившиеся в период с 2020 по 2025 годы.

Об этом сообщает Finway

Выявленные уязвимости и результаты тестирования

В ходе тестирования ИИ-модели успешно смогли смоделировать эксплойты для почти половины исторических инцидентов, зафиксированных в выборке. Общая сумма активов, которые находились в сломанных контрактах на момент атак, превысила $550 млн. Отдельно команда Anthropic провела анализ контрактов, которые были взломаны после марта 2025 года — то есть уже после того, как ИИ-модели «отсекли» свои знания о этих событиях. На этой выборке ИИ смогли найти 19 уязвимостей из 34, что соответствует примерно $4,6 млн условных потерь.

«Эти случаи не были известны моделям заранее и содержали несколько новых типов дефектов, отметили представители компании.»

Лучший результат показала модель Claude Opus 4.5, которая смогла смоделировать эксплойты для 17 из 34 случаев, что означает условную «выручку» в $4,5 млн. Другие модели — Claude Sonnet 4.5 и GPT-5 — в сочетании с Opus 4.5 выявили 55,8% уязвимостей из тестового набора, что оценивается примерно в $4,6 млн активов.

Важность открытого бенчмарка и влияние на безопасность

Anthropic также проверила способность ИИ находить уязвимости в новых смарт-контрактах, которые ранее не были предметом анализа. В результате было выявлено две уязвимости «нулевого дня» на новых адресах, что, по мнению экспертов, демонстрирует возможность искусственного интеллекта фиксировать ошибки без предварительных сигналов или исторических данных.

Компания подчеркивает, что цель исследования — не эксплуатация уязвимостей, а создание инструментов для оценки эффективности ИИ-систем в выявлении дефектов кода. Anthropic планирует использовать SCONE-bench как открытый стандарт в тестировании и сравнении возможностей больших языковых моделей (LLM).

Исследователи отмечают, что эти модели могут быть полезными для разработчиков и аудиторов смарт-контрактов, помогая находить ошибки еще до запуска в блокчейн. Однако компания предостерегает, что исследование не является полной оценкой рисков, поскольку анализ ограничен историческими контрактами и контролируемой средой. В дальнейшем Anthropic планирует расширять бенчмарк и исследовать возможности использования ИИ-инструментов для повышения безопасности блокчейн-протоколов.

Результаты поиска уязвимостей с использованием различных ИИ-моделей. Данные: Anthropic.