От Qwen
Qwen3, the latest generation in the Qwen large language model series, features both dense and mixture-of-experts (MoE) architectures to excel in reasoning, multilingual support, and advanced agent tasks. Its unique...
Qwen3 30B A3B — это высокопроизводительная мультимодальная модель из новейшей серии Qwen3, использующая инновационную разреженную архитектуру Mixture-of-Experts (MoE). Обладая общим объемом в 30 миллиардов параметров, модель активирует всего 3 миллиарда на каждом шаге генерации, что обеспечивает рекордную скорость работы и низкое потребление памяти при сохранении интеллекта уровня полноценных 30B систем.
Модель была разработана как универсальное и эффективное решение для широкого спектра прикладных задач: от ведения диалогов до управления ИИ-агентами.
Qwen3 30B A3B показывает впечатляющие результаты, обходя многие более тяжелые модели в тестах на логику и программирование.
| Бенчмарк | Результат | Описание |
|---|---|---|
| Arena Elo | 1431 | Высокий профессиональный уровень |
| HumanEval | 88.9% | Отличное качество генерации программного кода |
| MMLU | 87.6% | Глубокие общие знания и эрудиция |
| MATH | 86.7% | Математические способности и логика |
| GPQA | 71.4% | Научные вопросы PhD-уровня |
| SWE_bench | 54.4% | Решение инженерных задач |
Qwen3 30B A3B доступна через API по крайне выгодной цене: всего $0.08 за 1M входных токенов и $0.28 за 1M выходных токенов. Благодаря своей MoE-архитектуре, она предлагает одно из лучших на рынке соотношений интеллекта к стоимости инференса, открывая доступ к передовому ИИ для самых широких кругов разработчиков.
Плюсы:
Минусы:
Опыт запуска Qwen3 30B A3B на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.08 / $0.28 за 1M токенов