От Qwen
Qwen3 Coder Flash — высокоскоростная MoE-модель Alibaba (30.5 млрд параметров, 3.3 млрд активных). Глубоко оптимизирована для автономных кодинг-агентов, рефакторинга и планирования. Контекст до 1M токенов, цена $0.20/$0.97 за 1 млн токенов.
Опыт запуска Qwen3 Coder Flash на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.20 / $0.97 за 1M токенов