К списку моделей

Qwen3 Coder Flash

4.9

От Qwen

Open Source
CTX1M
Релиз: 2025-09-17
FastGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3 Coder Flash — высокоскоростная MoE-модель Alibaba (30.5 млрд параметров, 3.3 млрд активных). Глубоко оптимизирована для автономных кодинг-агентов, рефакторинга и планирования. Контекст до 1M токенов, цена $0.20/$0.97 за 1 млн токенов.

На чем запустили?

Опыт запуска Qwen3 Coder Flash на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.20 / $0.97 за 1M токенов

Профиль модели

MMLU82.1%Code77.7%Math72.2%GPQA63.2%SWE52.1%

Бенчмарки

Arena Elo (LMSYS)1365
MMLU (Общие знания)82.1%
HumanEval (Кодинг)77.7%
MATH (Математика)72.2%
GPQA (Экспертные знания)63.2%
SWE-bench (Разработка)52.1%

Другие модели семейства Qwen