К списку моделей

Qwen3 Coder 30B A3B Instruct

4.3

От Qwen

Open Source
CTX160K
Релиз: 2025-07-31
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use. Built on the...

Подробный обзор модели

Qwen3 Coder 30B A3B Instruct — это высокопроизводительная специализированная модель из новейшей серии Qwen3, созданная для автономной инженерии программного обеспечения и глубокого анализа кода. С архитектурой Mixture-of-Experts (MoE) на 30.5 миллиардов параметров, модель активирует всего 8 экспертов (около 3 миллиардов параметров) на каждом шаге, предлагая исключительную точность в программировании при рекордной скорости работы.

Архитектура и кодинг-агенты

Модель была специально оптимизирована для работы в составе сложных мультиагентных систем и автономных кодинг-помощников.

  • Мастерство инструментов (Tool Use): Qwen3 Coder 30B безупречно владеет механизмами выбора и использования инструментов. Она умеет самостоятельно вызывать функции API, запускать линтеры и компиляторы, а также интерпретировать результаты тестов для итеративной отладки кода.
  • Репозиторное понимание (160K контекст): Поддержка расширенного контекстного окна до 160 000 токенов позволяет модели «видеть» структуру целых проектов. Это критично для корректного рефакторинга, миграции библиотек и поиска архитектурных уязвимостей, затрагивающих множество файлов.
  • Инструктивная точность: Модель прошла усиленную процедуру дообучения на следование сложным инженерным инструкциям, что минимизирует отклонения от заданных стандартов кодирования и архитектурных паттернов.

Производительность и бенчмарки

Qwen3 Coder 30B A3B Instruct показывает стабильно высокие результаты в профессиональных тестах, становясь одним из лучших решений в своём весовом классе для разработки ПО.

БенчмаркРезультатОписание
Arena Elo1413Лидер среди специализированных 30B моделей
HumanEval86.1%Высокое качество генерации программного кода
MMLU86.1%Глубокие общие знания и эрудиция
GPQA65.9%Научные тесты PhD-уровня
SWE_bench59.1%Эффективное решение реальных задач в коде
MATH82.3%Сильные математические способности

Ценообразование и доступность

Модель доступна через API по крайне выгодной цене: $0.07 за 1M входных токенов и $0.27 за 1M выходных токенов. Это делает её идеальным инструментом для профессиональных команд разработки, позволяя автоматизировать рутинные задачи кодирования и аудита при минимальных затратах.

Идеальные сценарии применения (Use Cases)

  • Автономные кодинг-агенты: Создание систем, способных самостоятельно вести тикеты от описания до реализации и тестирования.
  • Глубокий рефакторинг и миграция: Перенос крупных проектов на новые фреймворки и оптимизация устаревшего кода.
  • Интеллектуальный аудит безопасности: Поиск сложных логических уязвимостей в программном обеспечении.

Плюсы и минусы

Плюсы:

  • Исключительная точность в задачах программирования и использования инструментов.
  • Очень выгодная стоимость API.
  • Расширенное контекстное окно (160K).
  • Высокая скорость работы благодаря MoE-архитектуре.

Минусы:

  • Узкая специализация на коде (менее эффективна в творческих текстовых задачах).
  • Требует специфической инфраструктуры для оптимального инференса MoE.

На чем запустили?

Опыт запуска Qwen3 Coder 30B A3B Instruct на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.07 / $0.27 за 1M токенов

Профиль модели

MMLU86.1%Code86.1%Math82.3%GPQA65.9%SWE59.1%

Бенчмарки

Arena Elo (LMSYS)1413
MMLU (Общие знания)86.1%
HumanEval (Кодинг)86.1%
MATH (Математика)82.3%
GPQA (Экспертные знания)65.9%
SWE-bench (Разработка)59.1%

Другие модели семейства Qwen