От Qwen
The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. It delivers...
Qwen3.5 397B A17B — это монументальная мультимодальная модель с открытыми весами от команды Qwen, представленная в феврале 2026 года. Она построена на уникальной гибридной архитектуре, сочетающей механизмы линейного внимания (linear attention) с разреженной структурой Mixture-of-Experts (MoE). Это позволяет модели обладать колоссальной базой знаний при сохранении высокой эффективности инференса.
Использование линейного внимания в сочетании с MoE (активация 17 млрд параметров из 397 млрд) — это настоящий прорыв. Такая структура обеспечивает практически неограниченную масштабируемость при работе с длинным контекстом, значительно снижая вычислительные затраты на генерацию каждого токена по сравнению с традиционными трансформерами.
Модель изначально обучалась как мультимодальная система. Она демонстрирует глубокое понимание визуальных сцен, текста на изображениях и сложных диаграмм, бесшовно интегрируя визуальную информацию в общую логику рассуждения.
Поддержка контекстного окна в 262 000 токенов позволяет Qwen3.5 анализировать огромные массивы данных, включая целые библиотеки документов или длинные видеозаписи, находя скрытые связи и формируя комплексные выводы флагманского уровня.
| Бенчмарк | Результат Qwen3.5 397B | Категория |
|---|---|---|
| Arena Elo | 1454 | Топ-уровень открытых гигантов |
| MMLU | 89.5% | Общие знания |
| HumanEval | 88.6% | Написание кода |
| MATH | 96.7% | Математика (премиум уровень) |
| GPQA | 69.9% | Научные вопросы |
| SWE_bench | 58.1% | Решение инженерных задач |
Несмотря на свои гигантские размеры, благодаря MoE-архитектуре, модель доступна через API по весьма умеренной цене: $0.39 за 1M входных токенов. Это делает Qwen3.5 397B одним из самых мощных и доступных инструментов для решения задач «Frontier»-уровня.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
Опыт запуска Qwen3.5 397B A17B на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.39 / $2.34 за 1M токенов