К списку моделей

Qwen3 Coder 480B A35B

4.4

От Qwen

Open Source
CTX262K
Релиз: 2025-07-23
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3-Coder-480B-A35B-Instruct is a Mixture-of-Experts (MoE) code generation model developed by the Qwen team. It is optimized for agentic coding tasks such as function calling, tool use, and long-context reasoning over...

Подробный обзор модели

Обзор Qwen3 Coder 480B: Открытый титан программирования (2026)

Qwen3 Coder 480B A35B, выпущенная Alibaba Cloud в июле 2025 года, стала самой большой и мощной открытой моделью для генерации кода в истории. Используя продвинутую архитектуру Mixture-of-Experts (MoE), она предлагает возможности, которые ранее были доступны только в закрытых системах вроде GPT-4o или Claude 3.5.

Главные преимущества

1. Гигантский масштаб (480B / 35B активных)

Модель содержит 480 миллиардов параметров, что позволяет ей хранить знания практически о всех существующих языках программирования и фреймворках. При этом на каждый токен активируется всего 35 миллиардов параметров, обеспечивая разумную скорость работы при колоссальной базе знаний.

2. Нативная поддержка ИИ-агентов

Qwen3 Coder был специально обучен для работы в качестве автономного разработчика. Модель идеально понимает протоколы вызова инструментов, умеет работать с консолью, отладчиками и Git, что делает её идеальным ядром для систем вроде Cursor или Devin.

3. Контекст 262K

Широкое окно контекста позволяет модели анализировать целые библиотеки и сложные иерархии классов, понимая взаимосвязи между разрозненными модулями кода.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат Qwen3 CoderКатегория
Arena Elo1442Топ открытых кодеров
HumanEval79.5%Точность на атомарных функциях
MATH91.9%Математическая логика
GPQA70.3%Сложные технические вопросы
MMLU88.5%Общий интеллект

Сценарии использования

  • Корпоративная ИИ-разработка: Создание внутренних инструментов автоматизации кодинга на собственных мощностях.
  • Архитектурное проектирование: Помощь в планировании сложных систем и миграции кодовых баз.
  • Обучение ИИ: Использование в качестве «учителя» для дистилляции более мелких моделей программирования.

Ценообразование

Через облачные API модель доступна по цене: $0.22 за 1M входных токенов и $1.80 за 1M выходных токенов.


Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

На чем запустили?

Опыт запуска Qwen3 Coder 480B A35B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.22 / $1.80 за 1M токенов

Профиль модели

MMLU88.5%Code79.5%Math91.9%GPQA70.3%SWE46.2%

Бенчмарки

Arena Elo (LMSYS)1442
MMLU (Общие знания)88.5%
HumanEval (Кодинг)79.5%
MATH (Математика)91.9%
GPQA (Экспертные знания)70.3%
SWE-bench (Разработка)46.2%

Другие модели семейства Qwen