К списку моделей

Qwen3.5-122B-A10B

4.7

От Qwen

Open Source
CTX262K
Релиз: 2026-02-25
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. In terms of...

Подробный обзор модели

Qwen3.5 122B A10B — это высокопроизводительная мультимодальная модель из новейшей серии Qwen3.5, использующая инновационную гибридную архитектуру. С общим объемом в 122 миллиарда параметров, модель активирует лишь 10 миллиардов на каждом шаге генерации, что обеспечивает феноменальную скорость работы и рекордную эффективность при сохранении интеллекта флагманского уровня.

Гибридная архитектура и мультимодальность

Модель Qwen3.5 122B A10B является результатом технологического прорыва в области разреженных вычислений.

  • SSM-Transformer Hybrid: Модель объединяет в себе блоки линейного внимания (аналог архитектуры Mamba) с классическими слоями трансформеров. Это позволяет ей демонстрировать субквадратичную масштабируемость памяти, что критично для работы со сверхдлинными контекстами.
  • Нативное зрение: Модель изначально проектировалась как vision-language система. Она нативно понимает изображения, видео и сложные документы, бесшовно интегрируя визуальные данные в общую логику рассуждений без использования внешних модулей.
  • Расширенный контекст 262K: Поддержка контекстного окна в 262 000 токенов в сочетании с гибридной архитектурой делает Qwen3.5 122B одной из самых быстрых моделей для анализа сверхбольших массивов данных.

Производительность и бенчмарки

Модель уверенно занимает топовые позиции в рейтингах мультимодальных открытых систем, показывая выдающиеся результаты в математике и точных науках.

БенчмаркРезультатОписание
MATH92.8%Исключительная точность в математических рассуждениях
Arena Elo1428Высокий флагманский уровень
MMLU87.3%Глубокие общие знания и эрудиция
HumanEval81.5%Высокое качество генерации программного кода
GPQA63.7%Научные вопросы PhD-уровня
SWE_bench49.3%Решение инженерных задач

Ценообразование и доступность

Qwen3.5 122B A10B доступна через API по крайне привлекательной цене: $0.26 за 1M входных токенов и $2.08 за 1M выходных токенов. Благодаря своей архитектуре, она предлагает одно из лучших на рынке соотношений мощности и стоимости инференса, совершая революцию в доступности премиального ИИ.

Идеальные сценарии применения (Use Cases)

  • Глубокая аналитика мультимедиа: Автоматическое описание и поиск по часовым видеоархивам и гигантским пакетам отсканированных документов.
  • Научное моделирование: Помощь в решении сложных математических задач и верификации научных данных в рамках широкого контекста.
  • Масштабируемые агентные системы: Использование в качестве ядра автономных ИИ-сотрудников, требующих высокой скорости реакции и точности.

Плюсы и минусы

Плюсы:

  • Рекордная эффективность инференса (10B активных параметров из 122B).
  • Феноменальная точность в математике и логике.
  • Огромное контекстное окно (262K).
  • Нативная мультимодальность (зрение + видео).

Минусы:

  • Требует специфической оптимизации софта для раскрытия потенциала гибридной архитектуры.
  • В задачах на чистое творческое письмо может уступать плотным флагманам.

На чем запустили?

Опыт запуска Qwen3.5-122B-A10B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.26 / $2.08 за 1M токенов

Профиль модели

MMLU87.3%Code81.5%Math92.8%GPQA63.7%SWE49.3%

Бенчмарки

Arena Elo (LMSYS)1428
MMLU (Общие знания)87.3%
HumanEval (Кодинг)81.5%
MATH (Математика)92.8%
GPQA (Экспертные знания)63.7%
SWE-bench (Разработка)49.3%

Другие модели семейства Qwen