К списку моделей

DeepSeek V3.1

4.5

От DeepSeek

Open Source
CTX33K
Релиз: 2025-08-21
StandardGeneralTextОткрытые веса
Официальный сайт

Краткое описание

DeepSeek-V3.1 is a large hybrid reasoning model (671B parameters, 37B active) that supports both thinking and non-thinking modes via prompt templates. It extends the DeepSeek-V3 base with a two-phase long-context...

Подробный обзор модели

DeepSeek V3.1 — это мощная мультимодальная модель с открытыми весами, использующая инновационную разреженную архитектуру Mixture-of-Experts (MoE). С общим объемом в 671 миллиард параметров, модель активирует всего 37 миллиардов на каждом шаге, что обеспечивает рекордную скорость работы и низкую стоимость инференса при сохранении интеллекта флагманского уровня. Версия 3.1 получила значительные улучшения в области долгосрочной памяти, пошагового рассуждения и стабильности работы в агентных сценариях.

Архитектура и гибридное рассуждение

DeepSeek V3.1 представляет собой венец инженерной мысли команды DeepSeek, объединяя способности к быстрому чату и глубокому анализу.

  • Поддержка режимов Thinking: Модель нативно поддерживает переключение между стандартным ответом и режимом глубокого «мышления» через промпт-шаблоны. Это позволяет пользователям получать мгновенные ответы на простые вопросы или активировать цепочки рассуждений для решения сложных логических задач.
  • Двухфазный Long-Context: В версии 3.1 была внедрена обновленная система работы с контекстом, оптимизирующая извлечение информации на сверхдлинных дистанциях. Это делает модель идеальной для анализа гигантских документов и кодовых баз.
  • Мастерство программирования: Модель традиционно сильна в написании кода и математике, соревнуясь на равных с лучшими мировыми флагманами (GPT-4.1, Claude 3.7).

Производительность и бенчмарки

DeepSeek V3.1 уверенно занимает топовые позиции в мировых рейтингах, подтверждая статус одной из самых интеллектуальных открытых моделей в истории.

БенчмаркРезультатОписание
MATH90.6%Исключительная точность в математических рассуждениях (премиум)
Arena Elo1408Высокий флагманский уровень
MMLU85.7%Глубокие общие знания и эрудиция
HumanEval82.3%Высокое качество генерации программного кода
GPQA63.0%Научные вопросы PhD-уровня
SWE_bench51.8%Решение инженерных задач в реальных условиях

Ценообразование и доступность

DeepSeek V3.1 доступна в виде открытых весов и через API популярных агрегаторов по крайне привлекательной цене: всего $0.15 за 1M входных токенов и $0.75 за 1M выходных токенов. Это делает её одним из самых выгодных решений для систем, требующих интеллекта уровня «Frontier» за долю стоимости западных аналогов.

Идеальные сценарии применения (Use Cases)

  • Профессиональный кодинг и аудит: Автоматизация написания кода, поиск сложных логических багов и проектирование систем.
  • Глубокая аналитика текстов: Обработка сверхбольших массивов неструктурированной информации с извлечением скрытых закономерностей.
  • Сложные агентные ворклоу: Использование в качестве ядра автономных систем, требующих пошагового планирования и верификации действий.

Плюсы и минусы

Плюсы:

  • Рекордное соотношение интеллекта и стоимости API.
  • Нативная поддержка режимов «мышления» (Thinking).
  • Эффективная MoE-архитектура.
  • Открытые веса (доступ к технологиям DeepSeek).

Минусы:

  • Требует экстремально мощных GPU-кластеров для эффективного локального запуска.
  • Ограниченное контекстное окно в текущей реализации API (33K).

На чем запустили?

Опыт запуска DeepSeek V3.1 на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.15 / $0.75 за 1M токенов

Профиль модели

MMLU85.7%Code82.3%Math90.6%GPQA63%SWE51.8%

Бенчмарки

Arena Elo (LMSYS)1408
MMLU (Общие знания)85.7%
HumanEval (Кодинг)82.3%
MATH (Математика)90.6%
GPQA (Экспертные знания)63%
SWE-bench (Разработка)51.8%

Другие модели семейства DeepSeek