К списку моделей

Qwen3 Next 80B A3B Thinking

4.5

От Qwen

Open Source
CTX131K
Релиз: 2025-09-11
StandardReasoningTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3-Next-80B-A3B-Thinking is a reasoning-first chat model in the Qwen3-Next line that outputs structured “thinking” traces by default. It’s designed for hard multi-step problems; math proofs, code synthesis/debugging, logic, and agentic...

Подробный обзор модели

Qwen3 Next 80B A3B Thinking — это специализированная «рассуждающая» модель из новейшей серии Qwen3 Next, созданная специально для решения сложнейших многошаговых задач в области математики, логики и программирования. С архитектурой Mixture-of-Experts (MoE) на 80 миллиардов параметров, модель активирует лишь 3 миллиарда на каждом шаге, предлагая уникальное сочетание глубокого аналитического интеллекта и высокой скорости инференса.

Особенности и механизмы рассуждения

Модель была разработана как «reasoning-first» система, ориентированная на профессионалов, которым важна прозрачность и точность логического вывода.

  • Thinking Traces по умолчанию: Ключевой фишкой Qwen3 Next Thinking является автоматическая генерация структурированных цепочек рассуждений (thinking traces) в каждом ответе. Это позволяет пользователям детально изучать логику модели, находить ошибки в постановке задачи и эффективно корректировать действия ИИ.
  • Мастерство STEM-дисциплин: Модель демонстрирует исключительные результаты в математических доказательствах, синтезе сложного кода и решении олимпиадных логических задач. Она обучена «задумываться» перед выдачей ответа, проводя внутреннюю верификацию гипотез.
  • Широкий контекст 131K: Поддержка контекстного окна до 131 072 токенов позволяет модели эффективно анализировать объемные научные статьи и технические спецификации, сохраняя безупречную логику на протяжении всей сессии.

Производительность и бенчмарки

Модель уверенно занимает топовые позиции среди «рассуждающих» систем среднего веса, соревнуясь с лучшими закрытыми аналогами в точности логического вывода.

БенчмаркРезультатОписание
MATH89.2%Исключительная точность в математических рассуждениях
Arena Elo1413Высокий профессиональный уровень
HumanEval87.0%Высокое качество генерации программного кода
MMLU86.1%Глубокие общие знания и эрудиция
GPQA63.6%Научные вопросы PhD-уровня
SWE_bench55.3%Решение прикладных инженерных задач

Ценообразование и доступность

Qwen3 Next 80B A3B Thinking доступна через API по крайне привлекательной цене: $0.10 за 1M входных токенов и $0.78 за 1M выходных токенов. Это делает её идеальным инструментом для разработчиков, внедряющих функции глубокого интеллектуального анализа и пошагового рассуждения в свои продукты по минимальной стоимости.

Идеальные сценарии применения (Use Cases)

  • Математическое и научное моделирование: Помощь в решении сложных уравнений, проверке гипотез и написании академических работ с видимой логикой вывода.
  • Профессиональный кодинг и отладка: Написание сложных алгоритмов и поиск трудноуловимых логических багов в коде.
  • Аналитические системы принятия решений: Использование в качестве ядра систем, требующих детального обоснования каждого шага.

Плюсы и минусы

Плюсы:

  • Прозрачные цепочки рассуждений (Thinking Traces).
  • Рекордная точность в математике и STEM-задачах.
  • Очень выгодная стоимость API.
  • Эффективная MoE-архитектура.

Минусы:

  • Более высокая задержка ответа по сравнению с «быстрыми» чат-моделями.
  • Требует четко структурированных промптов для раскрытия полного потенциала Thinking-режима.

На чем запустили?

Опыт запуска Qwen3 Next 80B A3B Thinking на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.10 / $0.78 за 1M токенов

Профиль модели

MMLU86.1%Code87%Math89.2%GPQA63.6%SWE55.3%

Бенчмарки

Arena Elo (LMSYS)1413
MMLU (Общие знания)86.1%
HumanEval (Кодинг)87%
MATH (Математика)89.2%
GPQA (Экспертные знания)63.6%
SWE-bench (Разработка)55.3%

Другие модели семейства Qwen