От Qwen
Qwen3.6-35B-A3B is an open-weight multimodal model from Alibaba Cloud with 35 billion total parameters and 3 billion active parameters per token. It uses a hybrid sparse mixture-of-experts architecture combining Gated...
Qwen3.6 35B A3B — это высокопроизводительная мультимодальная модель из новейшей серии Qwen3.6, использующая инновационную разреженную архитектуру Mixture-of-Experts (MoE). С общим объемом в 35 миллиардов параметров, модель активирует всего 3 миллиарда на каждом шаге генерации, что обеспечивает рекордную скорость работы и низкое потребление памяти при сохранении интеллекта уровня полноценных 35B систем.
Модель Qwen3.6 35B A3B представляет собой результат глубокой оптимизации четвертого поколения алгоритмов MoE от команды Alibaba.
Qwen3.6 35B A3B демонстрирует выдающиеся результаты во всех ключевых дисциплинах, становясь одним из лидеров в своём весовом классе.
| Бенчмарк | Результат | Описание |
|---|---|---|
| Arena Elo | 1422 | Высокий профессиональный уровень |
| HumanEval | 86.7% | Высокое качество генерации программного кода |
| MMLU | 86.8% | Глубокие общие знания и эрудиция |
| GPQA | 62.8% | Научные вопросы PhD-уровня |
| MATH | 75.9% | Хорошие способности в математике и логике |
| SWE_bench | 47.9% | Решение инженерных задач в коде |
Qwen3.6 35B A3B доступна через API по крайне привлекательной цене: всего $0.16 за 1M входных токенов и $0.97 за 1M выходных токенов. Благодаря своей архитектуре, она предлагает одно из лучших на рынке соотношений мощности и стоимости инференса, совершая революцию в доступности премиального ИИ.
Плюсы:
Минусы:
Опыт запуска Qwen3.6 35B A3B на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.16 / $0.97 за 1M токенов