К списку моделей

Qwen3.5-35B-A3B

4.3

От Qwen

Open Source
CTX262K
Релиз: 2026-02-25
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency. Its overall...

Подробный обзор модели

Обзор Qwen3.5-35B-A3B: Эффективность MoE в среднем весе (2026)

Qwen3.5-35B-A3B — это высокопроизводительная мультимодальная модель с открытыми весами, использующая разреженную архитектуру Mixture-of-Experts (MoE). При общем объеме в 35 миллиардов параметров, модель активирует всего 3 миллиарда параметров для каждого токена, что обеспечивает феноменальную скорость работы и низкое потребление памяти при сохранении интеллекта уровня полноценных 35B моделей.

Ключевые черты Qwen3.5-35B-A3B

1. Гибридная архитектура с линейным вниманием

Модель построена на базе инновационного сочетания механизмов линейного внимания и MoE. Это позволяет Qwen3.5-35B работать с длинными последовательностями данных значительно быстрее традиционных трансформеров, делая её идеальным выбором для задач, требующих быстрого анализа больших объемов информации.

2. Нативная мультимодальность

Как и старшие модели серии 3.5, версия 35B изначально является vision-language моделью. Она отлично справляется с визуальным анализом, чтением документов и описанием изображений, бесшовно интегрируя визуальные данные в свои логические рассуждения.

3. Расширенный контекст 262K

Поддержка контекстного окна в 262 000 токенов — это огромный плюс для модели такого класса. Это позволяет пользователям бесплатно анализировать длинные статьи, техническую документацию и кодовые базы с высокой степенью детализации и точности.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат Qwen3.5 35BКатегория
Arena Elo1449Лидер среди 30B-35B MoE
MMLU89.1%Общие знания
HumanEval83.9%Написание кода
MATH94.5%Математические способности
GPQA72.5%Научные вопросы
SWE_bench54.8%Решение инженерных задач

Сценарии использования

  • Быстрые мультимодальные ассистенты: Создание отзывчивых ботов с поддержкой зрения для веб-сайтов и приложений.
  • Масштабируемый анализ текстов: Классификация и суммаризация огромных потоков неструктурированной информации.
  • Образовательные инструменты: Решение сложных математических задач и объяснение научных концепций в реальном времени.

Доступность и цена

Qwen3.5-35B-A3B доступна по крайне выгодной цене: $0.16 за 1M входных токенов. Благодаря своей MoE-архитектуре, она предлагает одно из лучших на рынке соотношений «интеллект/стоимость инференса», открывая доступ к передовым возможностям ИИ для самых широких кругов разработчиков.


Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

На чем запустили?

Опыт запуска Qwen3.5-35B-A3B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.16 / $1.30 за 1M токенов

Профиль модели

MMLU89.1%Code83.9%Math94.5%GPQA72.5%SWE54.8%

Бенчмарки

Arena Elo (LMSYS)1449
MMLU (Общие знания)89.1%
HumanEval (Кодинг)83.9%
MATH (Математика)94.5%
GPQA (Экспертные знания)72.5%
SWE-bench (Разработка)54.8%

Другие модели семейства Qwen