Google представляет Gemini 2.5 Deep Think — самую мощную модель ИИ для рассуждений

|
Google представляет Gemini 2.5 Deep Think — самую мощную модель ИИ для рассуждений

Google DeepMind официально представила свою новую модель искусственного интеллекта, Gemini 2.5 Deep Think, которую компания описывает как свою самую продвинутую систему для сложных рассуждений. Разработчики подчеркивают, что эта модель использует многопользовательский подход: одновременно тестируя несколько гипотез, чтобы найти оптимальные решения для самых сложных задач.

Об этом сообщает Finway

Премиум-доступ и уникальные функции Gemini 2.5 Deep Think

Первым, кто сможет воспользоваться Gemini 2.5 Deep Think, станут подписчики плана Google Ultra, стоимость которого составляет 250 долларов в месяц. Начиная с этой пятницы, пользователи этого плана получат доступ к новой модели непосредственно в приложении.

Сравнение Gemini 2.5 Deep Think с продуктами конкурентов. Данные: Google.
Сравнение Gemini 2.5 Deep Think с продуктами конкурентов. Данные: Google.

Преимущества модели над конкурентами и практические применения

Презентация Gemini 2.5 Deep Think впервые состоялась на конференции Google I/O 2025. По словам представителей компании, эта инновационная система помогла Google завоевать золотую медаль на Международной математической олимпиаде. В то же время ограниченная версия модели, адаптированная для задач, требующих длительных рассуждений и ориентированная на научные исследования, доступна для исследователей.

«Компания утверждает, что Gemini 2.5 Deep Think была значительно улучшена по сравнению с весенней версией. Разработчики Google внедрили новые методы обучения с подкреплением, что повысило эффективность алгоритмов рассуждений.»

В тесте HLE, который оценивает способность ИИ отвечать на вопросы в различных областях знаний, Gemini 2.5 Deep Think набрала 34.8% без дополнительных инструментов. Для сравнения, Grok 4 от xAI получила 25.4%, в то время как модель o3 от OpenAI набрала 20.3%. В тесте LiveCodeBench6 — программном тесте — Gemini 2.5 Deep Think также заняла первое место с результатом 87.6%, опередив Grok 4 (79%) и o3 от OpenAI (72%).

Google отмечает, что новая модель идеально подходит для решения задач, связанных с креативностью, стратегическим мышлением и реализацией сложных решений. Компания надеется, что отзывы исследователей помогут уточнить многопользовательскую архитектуру для дальнейших применений в науке и других областях.