К списку моделей

Qwen3 32B

4.8

От Qwen

Open Source
CTX41K
Релиз: 2025-04-28
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3 32B — это мощная плотная модель (32.8 млрд параметров), сочетающая высокую скорость и глубокое логическое мышление. Поддерживает режим «Thinking» для решения сложных математических и инженерных задач.

Подробный обзор модели

Qwen3-32B — это «золотая середина» в линейке Alibaba Cloud, выпущенная в апреле 2025 года. Эта модель доказывает, что при правильной архитектуре и качестве обучающих данных, 32 миллиарда параметров могут соревноваться с гигантами в сотни миллиардов параметров.

Архитектура и особенности

Модель построена на плотной (dense) архитектуре, что обеспечивает высокую стабильность и предсказуемость ответов.

  • Параметры: 32.8 млрд.
  • Контекстное окно: 128 000 токенов.
  • Оптимизация под STEM: Qwen3-32B прошла глубокое дообучение на массивах математических формул и технической документации.
  • Эффективность: модель идеально подходит для развертывания на пользовательском оборудовании (например, на одной или двух картах RTX 4090).

Производительность и бенчмарки

Несмотря на скромный размер, Qwen3-32B показывает феноменальные результаты в точных науках.

БенчмаркПоказательОсобенности
MATH 50096.1%Уровень топовых проприетарных моделей
AIME 202573.0%Высокая способность к олимпиадной логике
MMLU Pro79.8%Широкий кругозор и эрудиция
GPQA Diamond66.8%Научное мышление на высоком уровне

Цены и доступность

Qwen3-32B является одной из самых доступных моделей для разработчиков, предлагая качество флагманов по цене бюджетных решений.

  • Input: $0.08 за 1 млн токенов.
  • Output: $0.24 за 1 млн токенов.

Идеальные сценарии применения

  • Математические помощники: создание образовательных сервисов и репетиторов по точным наукам.
  • Копилот для кодинга: благодаря высокой скорости и точности в синтаксисе.
  • Локальные ИИ-ассистенты: для пользователей, заботящихся о приватности.
  • Анализ данных: быстрая обработка структурированной информации и CSV-файлов.

Плюсы и минусы

Плюсы:

  • Феноменальная точность для своего размера.
  • Очень низкая стоимость токенов.
  • Возможность запуска на домашнем железе.
  • Отличная поддержка русского языка.

Минусы:

  • Контекстное окно меньше, чем у серии 3.6.
  • Может уступать в творческом письме и нюансах психологии.

На чем запустили?

Опыт запуска Qwen3 32B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.08 / $0.24 за 1M токенов

Профиль модели

MMLU88.5%Code93%Math92.9%GPQA70.1%SWE62.4%

Бенчмарки

Arena Elo (LMSYS)1442
MMLU (Общие знания)88.5%
HumanEval (Кодинг)93%
MATH (Математика)92.9%
GPQA (Экспертные знания)70.1%
SWE-bench (Разработка)62.4%

Другие модели семейства Qwen