К списку моделей

Qwen3.6 35B A3B

4.5

От Qwen

Open Source
CTX262K
Релиз: 2026-04-27
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3.6-35B-A3B is an open-weight multimodal model from Alibaba Cloud with 35 billion total parameters and 3 billion active parameters per token. It uses a hybrid sparse mixture-of-experts architecture combining Gated...

Подробный обзор модели

Qwen3.6 35B A3B — это высокопроизводительная мультимодальная модель из новейшей серии Qwen3.6, использующая инновационную разреженную архитектуру Mixture-of-Experts (MoE). С общим объемом в 35 миллиардов параметров, модель активирует всего 3 миллиарда на каждом шаге генерации, что обеспечивает рекордную скорость работы и низкое потребление памяти при сохранении интеллекта уровня полноценных 35B систем.

Архитектура и MoE-эффективность

Модель Qwen3.6 35B A3B представляет собой результат глубокой оптимизации четвертого поколения алгоритмов MoE от команды Alibaba.

  • Гибридная MoE: Благодаря активации лишь 3 миллиардов параметров из 35, модель работает со скоростью компактных 3B-систем, но обладает «эрудицией» и глубиной рассуждений тяжеловесных моделей. Это делает её идеальным выбором для интерактивных ассистентов с миллионной аудиторией.
  • Нативная мультимодальность: Модель изначально обучалась как vision-language система. Она нативно понимает изображения и видео, умеет детально описывать визуальные сцены и находить скрытые взаимосвязи между текстом и картинкой.
  • Огромный контекст 262K: Поддержка контекстного окна в 262 000 токенов позволяет модели анализировать целые библиотеки документов или длительные видеоархивы за один проход, сохраняя идеальную связность выводов.

Производительность и бенчмарки

Qwen3.6 35B A3B демонстрирует выдающиеся результаты во всех ключевых дисциплинах, становясь одним из лидеров в своём весовом классе.

БенчмаркРезультатОписание
Arena Elo1422Высокий профессиональный уровень
HumanEval86.7%Высокое качество генерации программного кода
MMLU86.8%Глубокие общие знания и эрудиция
GPQA62.8%Научные вопросы PhD-уровня
MATH75.9%Хорошие способности в математике и логике
SWE_bench47.9%Решение инженерных задач в коде

Ценообразование и доступность

Qwen3.6 35B A3B доступна через API по крайне привлекательной цене: всего $0.16 за 1M входных токенов и $0.97 за 1M выходных токенов. Благодаря своей архитектуре, она предлагает одно из лучших на рынке соотношений мощности и стоимости инференса, совершая революцию в доступности премиального ИИ.

Идеальные сценарии применения (Use Cases)

  • Интеллектуальные мультимодальные ассистенты: Создание отзывчивых ботов с поддержкой зрения для мобильных и веб-приложений.
  • Масштабируемый анализ текстов и RAG: Эффективный поиск и суммаризация информации в гигантских корпоративных базах знаний.
  • Помощник разработчика: Генерация кода, написание тестов и помощь в отладке в реальном времени.

Плюсы и минусы

Плюсы:

  • Рекордная скорость генерации благодаря MoE (3B активных параметров).
  • Нативная поддержка видео и изображений.
  • Огромное контекстное окно (262K).
  • Очень низкая стоимость использования через API.

Минусы:

  • Требует специфической настройки инференса для эффективной работы MoE.
  • В сверхсложных философских рассуждениях может уступать плотным флагманам серии Qwen Max.

На чем запустили?

Опыт запуска Qwen3.6 35B A3B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.16 / $0.97 за 1M токенов

Профиль модели

MMLU86.8%Code86.7%Math75.9%GPQA62.8%SWE47.9%

Бенчмарки

Arena Elo (LMSYS)1422
MMLU (Общие знания)86.8%
HumanEval (Кодинг)86.7%
MATH (Математика)75.9%
GPQA (Экспертные знания)62.8%
SWE-bench (Разработка)47.9%

Другие модели семейства Qwen