От Qwen
The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency. Its overall...
Qwen3.5-35B-A3B — это высокопроизводительная мультимодальная модель с открытыми весами, использующая разреженную архитектуру Mixture-of-Experts (MoE). При общем объеме в 35 миллиардов параметров, модель активирует всего 3 миллиарда параметров для каждого токена, что обеспечивает феноменальную скорость работы и низкое потребление памяти при сохранении интеллекта уровня полноценных 35B моделей.
Модель построена на базе инновационного сочетания механизмов линейного внимания и MoE. Это позволяет Qwen3.5-35B работать с длинными последовательностями данных значительно быстрее традиционных трансформеров, делая её идеальным выбором для задач, требующих быстрого анализа больших объемов информации.
Как и старшие модели серии 3.5, версия 35B изначально является vision-language моделью. Она отлично справляется с визуальным анализом, чтением документов и описанием изображений, бесшовно интегрируя визуальные данные в свои логические рассуждения.
Поддержка контекстного окна в 262 000 токенов — это огромный плюс для модели такого класса. Это позволяет пользователям бесплатно анализировать длинные статьи, техническую документацию и кодовые базы с высокой степенью детализации и точности.
| Бенчмарк | Результат Qwen3.5 35B | Категория |
|---|---|---|
| Arena Elo | 1449 | Лидер среди 30B-35B MoE |
| MMLU | 89.1% | Общие знания |
| HumanEval | 83.9% | Написание кода |
| MATH | 94.5% | Математические способности |
| GPQA | 72.5% | Научные вопросы |
| SWE_bench | 54.8% | Решение инженерных задач |
Qwen3.5-35B-A3B доступна по крайне выгодной цене: $0.16 за 1M входных токенов. Благодаря своей MoE-архитектуре, она предлагает одно из лучших на рынке соотношений «интеллект/стоимость инференса», открывая доступ к передовым возможностям ИИ для самых широких кругов разработчиков.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
Опыт запуска Qwen3.5-35B-A3B на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.16 / $1.30 за 1M токенов