Alibaba представил «гибридные» ИИ-модели Qwen3

Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI. Introducing Qwen3! We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC— Qwen (@Alibaba_Qwen) April 28, 2025 Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы.  «Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость [...]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», — отметила команда в блоге.  Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов.  На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах. Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench. Напомним, в марте Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32.

Апр 29, 2025 - 16:30
 0
Alibaba представил «гибридные» ИИ-модели Qwen3

Alibaba-min

Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы. 

«Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость [...]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», — отметила команда в блоге. 

Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов. 

На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах.

Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench.

Напомним, в марте Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32.