От Qwen
Qwen3 32B — это мощная плотная модель (32.8 млрд параметров), сочетающая высокую скорость и глубокое логическое мышление. Поддерживает режим «Thinking» для решения сложных математических и инженерных задач.
Qwen3-32B — это «золотая середина» в линейке Alibaba Cloud, выпущенная в апреле 2025 года. Эта модель доказывает, что при правильной архитектуре и качестве обучающих данных, 32 миллиарда параметров могут соревноваться с гигантами в сотни миллиардов параметров.
Модель построена на плотной (dense) архитектуре, что обеспечивает высокую стабильность и предсказуемость ответов.
Несмотря на скромный размер, Qwen3-32B показывает феноменальные результаты в точных науках.
| Бенчмарк | Показатель | Особенности |
|---|---|---|
| MATH 500 | 96.1% | Уровень топовых проприетарных моделей |
| AIME 2025 | 73.0% | Высокая способность к олимпиадной логике |
| MMLU Pro | 79.8% | Широкий кругозор и эрудиция |
| GPQA Diamond | 66.8% | Научное мышление на высоком уровне |
Qwen3-32B является одной из самых доступных моделей для разработчиков, предлагая качество флагманов по цене бюджетных решений.
Плюсы:
Минусы:
Опыт запуска Qwen3 32B на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.08 / $0.24 за 1M токенов