От DeepSeek
DeepSeek V3 — это флагманская модель типа Mixture-of-Experts (MoE) с 685 млрд параметров. Версия 0324 является обновлением основной линейки, демонстрируя отличные результаты в программировании, математике и общих задачах рассуждения.
DeepSeek-V3.1 (версия 0324), представленная весной 2026 года, подтвердила репутацию DeepSeek как самого агрессивного игрока в плане соотношения цены и качества. Модель предлагает возможности уровня GPT-4o, будучи в десятки раз дешевле в эксплуатации.
V3.1 базируется на инновационной архитектуре MoE с 671 миллиардом параметров (37 млрд активных), используя проприетарные методы обучения на синтетических данных и rejection sampling.
Обновление 3.1 значительно подтянуло навыки модели в следовании инструкциям и кодинге.
| Бенчмарк | Показатель | Описание |
|---|---|---|
| SWE-bench | 66.0% | На уровне топовых моделей для разработки |
| MMLU-Pro | 81.2% | Высочайшая общая эрудиция |
| AIME | 59.4% | Уверенное решение сложных задач |
| GPQA | 68.4% | Научное мышление |
DeepSeek продолжает демпинговать рынок, делая использование мощных ИИ доступным даже для стартапов с минимальным бюджетом.
Плюсы:
Минусы:
Опыт запуска DeepSeek V3 0324 на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.20 / $0.77 за 1M токенов