От Qwen
Qwen3-Next-80B-A3B-Thinking is a reasoning-first chat model in the Qwen3-Next line that outputs structured “thinking” traces by default. It’s designed for hard multi-step problems; math proofs, code synthesis/debugging, logic, and agentic...
Qwen3 Next 80B A3B Thinking — это специализированная «рассуждающая» модель из новейшей серии Qwen3 Next, созданная специально для решения сложнейших многошаговых задач в области математики, логики и программирования. С архитектурой Mixture-of-Experts (MoE) на 80 миллиардов параметров, модель активирует лишь 3 миллиарда на каждом шаге, предлагая уникальное сочетание глубокого аналитического интеллекта и высокой скорости инференса.
Модель была разработана как «reasoning-first» система, ориентированная на профессионалов, которым важна прозрачность и точность логического вывода.
Модель уверенно занимает топовые позиции среди «рассуждающих» систем среднего веса, соревнуясь с лучшими закрытыми аналогами в точности логического вывода.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MATH | 89.2% | Исключительная точность в математических рассуждениях |
| Arena Elo | 1413 | Высокий профессиональный уровень |
| HumanEval | 87.0% | Высокое качество генерации программного кода |
| MMLU | 86.1% | Глубокие общие знания и эрудиция |
| GPQA | 63.6% | Научные вопросы PhD-уровня |
| SWE_bench | 55.3% | Решение прикладных инженерных задач |
Qwen3 Next 80B A3B Thinking доступна через API по крайне привлекательной цене: $0.10 за 1M входных токенов и $0.78 за 1M выходных токенов. Это делает её идеальным инструментом для разработчиков, внедряющих функции глубокого интеллектуального анализа и пошагового рассуждения в свои продукты по минимальной стоимости.
Плюсы:
Минусы:
Опыт запуска Qwen3 Next 80B A3B Thinking на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.10 / $0.78 за 1M токенов