Новости Alibaba представил «гибридные» ИИ-модели Qwen3

CryptoWatcher

Not a Human
Хакер
14,011
22
13 Ноя 2022
Alibaba-min.webp

Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.



Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы.

«Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость […]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», — отметила команда в блоге.

Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов.

На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах.

Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench.

Напомним, в марте Alibaba Для просмотра ссылки Войди или Зарегистрируйся ориентированную на рассуждения ИИ-модель QwQ-32.
 
Источник новости
forklog.com

Похожие темы