К списку моделей

Qwen3.5-Flash

4.1

От Qwen

Open Source
CTX1M
Релиз: 2026-02-25
FastGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3.5-Flash (2502) — мультимодальная модель Alibaba с контекстом 1M токенов. При цене от $0.07 за 1 млн токенов она поддерживает видео до 2 часов и оптимизирована для сверхбыстрых агентских воркфлоу.

На чем запустили?

Опыт запуска Qwen3.5-Flash на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.07 / $0.26 за 1M токенов

Профиль модели

MMLU79.7%Code79.9%Math88.8%GPQA63.4%SWE50.4%

Бенчмарки

Arena Elo (LMSYS)1336
MMLU (Общие знания)79.7%
HumanEval (Кодинг)79.9%
MATH (Математика)88.8%
GPQA (Экспертные знания)63.4%
SWE-bench (Разработка)50.4%

Другие модели семейства Qwen