К списку моделей

DeepSeek V3.2 Exp

4.7

От DeepSeek

Open Source
CTX164K
Релиз: 2025-09-29
StandardGeneralTextОткрытые веса
Официальный сайт

Краткое описание

DeepSeek V3.2 Exp — экспериментальная MoE-модель (671 млрд параметров), внедрившая технологию разреженного внимания DSA. Обеспечивает скорость в 2-3 раза выше оригинала при сохранении флагманского интеллекта. Контекст 128K, цена $0.27/$0.41 за 1 млн токенов.

На чем запустили?

Опыт запуска DeepSeek V3.2 Exp на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.27 / $0.41 за 1M токенов

Профиль модели

MMLU82.5%Code81.9%Math73.2%GPQA61.4%SWE48.2%

Бенчмарки

Arena Elo (LMSYS)1370
MMLU (Общие знания)82.5%
HumanEval (Кодинг)81.9%
MATH (Математика)73.2%
GPQA (Экспертные знания)61.4%
SWE-bench (Разработка)48.2%

Другие модели семейства DeepSeek