От Qwen
The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. In terms of...
Qwen3.5 122B A10B — это высокопроизводительная мультимодальная модель из новейшей серии Qwen3.5, использующая инновационную гибридную архитектуру. С общим объемом в 122 миллиарда параметров, модель активирует лишь 10 миллиардов на каждом шаге генерации, что обеспечивает феноменальную скорость работы и рекордную эффективность при сохранении интеллекта флагманского уровня.
Модель Qwen3.5 122B A10B является результатом технологического прорыва в области разреженных вычислений.
Модель уверенно занимает топовые позиции в рейтингах мультимодальных открытых систем, показывая выдающиеся результаты в математике и точных науках.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MATH | 92.8% | Исключительная точность в математических рассуждениях |
| Arena Elo | 1428 | Высокий флагманский уровень |
| MMLU | 87.3% | Глубокие общие знания и эрудиция |
| HumanEval | 81.5% | Высокое качество генерации программного кода |
| GPQA | 63.7% | Научные вопросы PhD-уровня |
| SWE_bench | 49.3% | Решение инженерных задач |
Qwen3.5 122B A10B доступна через API по крайне привлекательной цене: $0.26 за 1M входных токенов и $2.08 за 1M выходных токенов. Благодаря своей архитектуре, она предлагает одно из лучших на рынке соотношений мощности и стоимости инференса, совершая революцию в доступности премиального ИИ.
Плюсы:
Минусы:
Опыт запуска Qwen3.5-122B-A10B на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.26 / $2.08 за 1M токенов