К списку моделей

Qwen3 235B A22B Instruct 2507

4.9

От Qwen

Open Source
CTX262K
Релиз: 2025-07-21
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3 235B A22B Instruct 2507 — флагманская MoE-модель от Alibaba (235 млрд параметров, 22 млрд активных). Контекстное окно 256K, цена $0.07/$0.10 за 1 млн токенов. Открытая лицензия Apache 2.0 и лидерство в многоязычных бенчмарках.

На чем запустили?

Опыт запуска Qwen3 235B A22B Instruct 2507 на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.07 / $0.10 за 1M токенов

Профиль модели

MMLU83.3%Code73.7%Math72.1%GPQA59.2%SWE48.2%

Бенчмарки

Arena Elo (LMSYS)1380
MMLU (Общие знания)83.3%
HumanEval (Кодинг)73.7%
MATH (Математика)72.1%
GPQA (Экспертные знания)59.2%
SWE-bench (Разработка)48.2%

Другие модели семейства Qwen