Компания Alibaba представила новую серию крупных языковых моделей (LLM) под названием Qwen3, которая включает модели с количеством параметров от 0,6 до 235 миллиардов. Разработчики утверждают, что новые модели демонстрируют конкурентоспособные результаты в ключевых задачах искусственного интеллекта, превосходя разработки таких компаний, как OpenAI и Google.
Об этом сообщает Finway
Преимущества моделей Qwen3
Модели Qwen3, которые входят в семейство гибридных решений, реализуют архитектуру MoE (Mixture of Experts), что позволяет эффективно распределять задачи между специализированными подмоделями. Это обеспечивает оптимизацию использования ресурсов, поскольку модели способны обрабатывать простые запросы и выполнять сложные вычисления по требованию. Общий объем учебных данных, использованных для тренировки моделей, составил примерно 36 триллионов токенов, включая разнообразные учебные материалы, код, Q&A и синтетические данные.
Доступность и рынок
На данный момент модели Qwen3 уже размещены на платформах Hugging Face и GitHub, и большинство из них доступны под открытой лицензией. Наибольшей моделью, которая в настоящее время доступна на открытом рынке, является Qwen3-32B, которая превзошла o1 от OpenAI в ряде тестов на код. Однако версия с 235 миллиардами параметров пока что не вышла в релиз.
По словам аналитиков, несмотря на существующие экспортные ограничения, китайские разработчики искусственного интеллекта все активнее конкурируют на международном рынке, приближаясь к уровню западных лидеров. Недавно OpenAI также представила новые модели ИИ — o3 и o4-mini, которые обещают значительный прогресс в развитии «умных» моделей.
Компания Alibaba отметила: «Introducing Qwen3! We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B.»
Таким образом, Alibaba продолжает укреплять свои позиции в индустрии искусственного интеллекта, предлагая новые решения, соответствующие современным требованиям инновационности и эффективности.