К списку моделей

R1 Distill Qwen 32B

4.4

От DeepSeek

Open Source
CTX33K
Релиз: 2025-01-29
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

DeepSeek-R1-Distill-Qwen-32B — модель для сложных рассуждений на базе Qwen-2.5. Демонстрирует олимпийский уровень в математике (MATH-500 94.3%) и программировании, являясь открытой альтернативой OpenAI o1-mini.

На чем запустили?

Опыт запуска R1 Distill Qwen 32B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.29 / $0.29 за 1M токенов

Профиль модели

MMLU82.1%Code83.7%Math89.6%GPQA62.7%SWE53.7%

Бенчмарки

Arena Elo (LMSYS)1365
MMLU (Общие знания)82.1%
HumanEval (Кодинг)83.7%
MATH (Математика)89.6%
GPQA (Экспертные знания)62.7%
SWE-bench (Разработка)53.7%

Другие модели семейства DeepSeek