К списку моделей

Qwen-Max

4.7

От Qwen

Open Source
CTX33K
Релиз: 2025-02-01
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

Qwen-Max — самая мощная модель в семействе Qwen2.5 (триллионная MoE-архитектура). Обучена на 20 трлн токенов, конкурирует с GPT-4o в кодинге и логике. Контекст до 128K, цена $1.04/$4.16 за 1 млн токенов.

На чем запустили?

Опыт запуска Qwen-Max на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$1.04 / $4.16 за 1M токенов

Профиль модели

MMLU83%Code81.1%Math81%GPQA60.9%SWE50.5%

Бенчмарки

Arena Elo (LMSYS)1376
MMLU (Общие знания)83%
HumanEval (Кодинг)81.1%
MATH (Математика)81%
GPQA (Экспертные знания)60.9%
SWE-bench (Разработка)50.5%

Другие модели семейства Qwen