К списку моделей

DeepSeek V4 Flash

4.1

От DeepSeek

Open Source
CTX1M
Релиз: 2026-04-24
FastGeneralTextОткрытые весаFrontier Efficiency
Официальный сайт

Краткое описание

DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...

На чем запустили?

Опыт запуска DeepSeek V4 Flash на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.14 / $0.28 за 1M токенов

Профиль модели

MMLU84.7%Code93.5%Math90.4%GPQA64.1%SWE64.9%

Бенчмарки

Arena Elo (LMSYS)1396
MMLU (Общие знания)84.7%
HumanEval (Кодинг)93.5%
MATH (Математика)90.4%
GPQA (Экспертные знания)64.1%
SWE-bench (Разработка)64.9%

Другие модели семейства DeepSeek