Grok 4 Basic — упрощенная версия флагманского искусственного интеллекта Grok 4 Heavy от компании xAI, представленная недавно под руководством Илона Маска. Его тестирование выявило как сильные стороны, так и существенные недостатки, в частности в области креативности, программирования и политической непредвзятости.
Об этом сообщает Finway
Политическая предвзятость и логика Grok 4
Журналисты выяснили, что Grok 4 Basic демонстрирует явную политическую предвзятость, особенно во время ответов на вопросы о социально чувствительных темах — войне в Газе, абортах или других спорных вопросах. Ответы чат-бота нередко опирались на позицию Илона Маска или источники, разделяющие его взгляды. При этом исследователи не обнаружили никаких явных инструкций в системном промпте, которые бы заставляли ИИ ориентироваться именно на эти источники, что ставит под сомнение прозрачность работы алгоритмов.
«Этот “максимально стремящийся к правде” ИИ, который Маск обещал во время запуска, ищет истину преимущественно через призму соцсетей своего создателя», — отметили авторы рецензии.
В логических и юридических задачах Grok 4 показал высокий уровень аналитики. Например, на вопрос: «Может ли мужчина жениться на сестре своей вдовы?», модель четко выявила логическую ошибку и предоставила юридически корректный ответ с объяснением.
Недостатки в креативности и программировании
Однако в области креативных задач Grok 4 Basic продемонстрировал слабые результаты. Тексты, созданные ботом, были клишированными, с невыразительными диалогами и низким нарративным качеством. Журналисты рекомендуют использовать Grok 4 для построения сюжетной схемы, а для написания художественных текстов выбрать альтернативный ИИ, например Claude 4 Opus.
В программировании модель испытывала трудности даже с простыми задачами — создать полноценную игру не удалось, а исправление одной ошибки приводило к появлению новых. По этому параметру предыдущая версия, Grok 3, оказалась более эффективной.
Голосовые возможности и работа с большим контекстом
Среди значительных преимуществ Grok 4 Basic — голосовая взаимодействие. Модель может озвучивать длинные тексты с разнообразной интонацией, а также предлагает несколько предварительно настроенных «личностей» для различных сценариев использования. Однако отсутствие функции совместного экрана ограничивает работу с визуальными материалами — для таких задач рекомендуется использовать Gemini Live.
Еще одним разочарованием стала неспособность Grok 4 обработать запросы большого объема: на тесте с 83 000 токенов модель отказалась работать, хотя компания xAI заявляет о поддержке контекста до 126 000 токенов.
В начале июля 2025 года xAI привлекла $10 млрд для развития Grok и расширения дата-центра Colossus. Это свидетельствует о серьезных планах компании по совершенствованию продукта и расширению его возможностей.
Вывод: для аналитики — да, для творчества — нет
Grok 4 Basic — это мощный инструмент для логических и аналитических задач, однако в сфере креативности и программирования он существенно уступает конкурентам. Его сильная сторона — голосовые функции, а вот политическая предвзятость и ограниченный функционал в сложных запросах могут стать решающими недостатками для многих пользователей.
«Если вас не пугает влияние Маска на ответы, вы получите ИИ с высоким уровнем аналитики и качественным голосовым взаимодействием. Но за $30 в месяц, если вам нужно больше — лучше поискать альтернативу», — подытожили в Decrypt.
В июне 2025 года Илон Маск сообщил о использовании Grok 3.5 для обработки человеческих знаний, что подтверждает амбиции xAI в сфере развития искусственного интеллекта.