К списку моделей

Qwen3 Coder 480B A35B (free)

4.9

От Qwen

Open Source
CTX262K
Релиз: 2025-07-23
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3-Coder-480B-A35B-Instruct is a Mixture-of-Experts (MoE) code generation model developed by the Qwen team. It is optimized for agentic coding tasks such as function calling, tool use, and long-context reasoning over...

Подробный обзор модели

Qwen3 Coder 480B A35B — это гигантская специализированная модель с открытыми весами, предназначенная для написания программного кода и управления сложными агентными ворклоу. Используя разреженную архитектуру Mixture-of-Experts (MoE) с общим объемом в 480 миллиардов параметров, модель активирует лишь 35 миллиардов на каждом шаге, обеспечивая рекордную точность программирования при сохранении высокой эффективности работы.

Архитектура и кодинг-агенты

Модель Qwen3 Coder была специально оптимизирована для задач «агентного кодинга», где ИИ выступает не просто как автодополнение, а как автономный инженер.

  • Мастерство инструментов (Tool Use): Модель идеально владеет механизмами вызова функций и использования внешних инструментов (компиляторы, линтеры, поисковые системы). Это позволяет ей самостоятельно запускать тесты и исправлять баги на основе логов ошибок.
  • Глубокое логическое рассуждение: Благодаря гигантской базе знаний (480B) и специфическому дообучению, модель способна проектировать сложные архитектуры распределенных систем и проводить глубокий рефакторинг в рамках 262K контекстного окна.
  • Оптимизированный инференс: Активация всего 35B параметров позволяет использовать эту мощную модель на современных GPU-кластерах с высокой скоростью генерации, недоступной плотным (dense) моделям аналогичного уровня интеллекта.

Производительность и бенчмарки

Модель является одним из мировых лидеров в области программирования и математики, показывая результаты на уровне лучших закрытых флагманов.

БенчмаркРезультатОписание
MATH96.2%Математические способности и логика (премиум уровень)
Arena Elo1435Топ-уровень кодинг-моделей
MMLU87.9%Глубокие общие знания и эрудиция
HumanEval87.3%Качество генерации программного кода
GPQA71.1%Научные вопросы PhD-уровня
SWE_bench60.7%Автономное решение инженерных задач

Доступность и цена

Бесплатная версия Qwen3 Coder доступна через API популярных агрегаторов (например, OpenRouter), что делает её незаменимым инструментом для разработчиков, которым требуется мощный специализированный интеллект для крупных проектов без затрат на API.

Идеальные сценарии применения (Use Cases)

  • AI Software Engineer: Создание систем, способных самостоятельно вести тикеты от описания до верифицированного решения.
  • Масштабный рефакторинг: Автоматическое обновление гигантских кодовых баз под новые стандарты и библиотеки.
  • Аудит безопасности: Поиск сложных логических уязвимостей в программном обеспечении.

Плюсы и минусы

Плюсы:

  • Феноменальная точность в математике и использовании инструментов.
  • Полностью бесплатный доступ по API.
  • Огромное контекстное окно (262K).
  • Высокая эффективность благодаря MoE-архитектуре.

Минусы:

  • Экстремально высокие требования для локального запуска (требуется мощный кластер).
  • Узкая специализация может делать её менее эффективной в чисто творческих текстовых задачах.

На чем запустили?

Опыт запуска Qwen3 Coder 480B A35B (free) на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.00 / $0.00 за 1M токенов

Профиль модели

MMLU87.9%Code87.3%Math96.2%GPQA71.1%SWE60.7%

Бенчмарки

Arena Elo (LMSYS)1435
MMLU (Общие знания)87.9%
HumanEval (Кодинг)87.3%
MATH (Математика)96.2%
GPQA (Экспертные знания)71.1%
SWE-bench (Разработка)60.7%

Другие модели семейства Qwen