К списку моделей

Qwen3 30B A3B

4.7

От Qwen

Open Source
CTX41K
Релиз: 2025-04-28
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3, the latest generation in the Qwen large language model series, features both dense and mixture-of-experts (MoE) architectures to excel in reasoning, multilingual support, and advanced agent tasks. Its unique...

Подробный обзор модели

Qwen3 30B A3B — это высокопроизводительная мультимодальная модель из новейшей серии Qwen3, использующая инновационную разреженную архитектуру Mixture-of-Experts (MoE). Обладая общим объемом в 30 миллиардов параметров, модель активирует всего 3 миллиарда на каждом шаге генерации, что обеспечивает рекордную скорость работы и низкое потребление памяти при сохранении интеллекта уровня полноценных 30B систем.

Особенности и MoE-архитектура

Модель была разработана как универсальное и эффективное решение для широкого спектра прикладных задач: от ведения диалогов до управления ИИ-агентами.

  • Ультра-эффективный инференс: Благодаря активации всего 3B параметров из 30B, модель работает значительно быстрее плотных (dense) аналогов. Это делает её идеальным выбором для интерактивных приложений и систем с высокой частотой запросов.
  • Мастерство рассуждения и логики: Qwen3 30B A3B демонстрирует глубокое понимание сложных условий и умение строить пошаговые выводы. Она особенно сильна в математических вычислениях и программировании для своего весового класса.
  • Глобальная поддержка языков: Модель изначально обучалась на огромном мультиязычном датасете, обеспечивая превосходное владение русским языком, понимание культурного контекста и точное следование локальным инструкциям.

Производительность и бенчмарки

Qwen3 30B A3B показывает впечатляющие результаты, обходя многие более тяжелые модели в тестах на логику и программирование.

БенчмаркРезультатОписание
Arena Elo1431Высокий профессиональный уровень
HumanEval88.9%Отличное качество генерации программного кода
MMLU87.6%Глубокие общие знания и эрудиция
MATH86.7%Математические способности и логика
GPQA71.4%Научные вопросы PhD-уровня
SWE_bench54.4%Решение инженерных задач

Доступность и цена

Qwen3 30B A3B доступна через API по крайне выгодной цене: всего $0.08 за 1M входных токенов и $0.28 за 1M выходных токенов. Благодаря своей MoE-архитектуре, она предлагает одно из лучших на рынке соотношений интеллекта к стоимости инференса, открывая доступ к передовому ИИ для самых широких кругов разработчиков.

Идеальные сценарии применения (Use Cases)

  • Интеллектуальные чат-боты среднего веса: Создание отзывчивых ассистентов для сайтов и приложений с высокой степенью точности ответов.
  • Инструменты автоматизации и RAG: Эффективный поиск и суммаризация информации в корпоративных базах знаний.
  • Помощник программиста: Генерация кода, написание тестов и помощь в отладке в реальном времени.

Плюсы и минусы

Плюсы:

  • Рекордная скорость генерации благодаря MoE (3B активных параметров).
  • Высокая точность в математике, коде и логике.
  • Превосходное владение русским языком.
  • Очень низкая стоимость использования через API.

Минусы:

  • Контекстное окно (41K) меньше, чем у флагманских моделей серии (262K).
  • Требует специфической настройки инференса для эффективной работы MoE.

На чем запустили?

Опыт запуска Qwen3 30B A3B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.08 / $0.28 за 1M токенов

Профиль модели

MMLU87.6%Code88.9%Math86.7%GPQA71.4%SWE54.4%

Бенчмарки

Arena Elo (LMSYS)1431
MMLU (Общие знания)87.6%
HumanEval (Кодинг)88.9%
MATH (Математика)86.7%
GPQA (Экспертные знания)71.4%
SWE-bench (Разработка)54.4%

Другие модели семейства Qwen