К списку моделей

Qwen3 235B A22B

4.7

От Qwen

Open Source
CTX131K
Релиз: 2025-04-28
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3-235B-A22B is a 235B parameter mixture-of-experts (MoE) model developed by Qwen, activating 22B parameters per forward pass. It supports seamless switching between a "thinking" mode for complex reasoning, math, and...

На чем запустили?

Опыт запуска Qwen3 235B A22B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.45 / $1.82 за 1M токенов

Профиль модели

MMLU85.2%Code78%Math90.5%GPQA61.6%SWE49.7%

Бенчмарки

Arena Elo (LMSYS)1402
MMLU (Общие знания)85.2%
HumanEval (Кодинг)78%
MATH (Математика)90.5%
GPQA (Экспертные знания)61.6%
SWE-bench (Разработка)49.7%

Другие модели семейства Qwen