От DeepSeek
DeepSeek V3 — это современная MoE-модель с 671 млрд параметров, предлагающая производительность уровня GPT-4o при значительно меньшей стоимости. Она демонстрирует рекордные показатели в программировании и математике.
DeepSeek V3 — это флагманская мультимодальная модель на базе архитектуры Mixture-of-Experts (MoE), представленная в конце 2024 года. Она совершила настоящий переворот на рынке LLM, предложив производительность уровня GPT-4o и Claude 3.5 Sonnet при стоимости в десятки раз ниже. Модель обучена на колоссальном массиве из 14.8 триллиона токенов и демонстрирует, что открытые решения могут не только догонять, но и перегонять закрытых лидеров рынка в ключевых дисциплинах.
В основе DeepSeek V3 лежит сложная архитектура с 671 миллиардом параметров, из которых только 37 миллиардов активируются для каждого отдельного токена. Это позволяет модели сохранять огромный запас знаний и при этом работать чрезвычайно быстро.
Ключевые технические инновации:
DeepSeek V3 показывает выдающиеся результаты, особенно в точных науках и программировании, где она зачастую оставляет позади признанных лидеров.
Хотя модель ориентирована на текст и код, она отлично справляется с многоязычным контентом и понимает сложные нюансы запросов на русском языке.
Главное оружие DeepSeek — агрессивная ценовая политика, которая делает V3 доступной для массового использования в бизнесе:
Для сравнения: использование GPT-4o обойдется в 10–15 раз дороже. При этом DeepSeek предлагает систему скидок за повторное использование кэша (Prompt Caching), что может снизить стоимость входящих токенов еще на 75%. Модель доступна через API DeepSeek, OpenRouter и другие крупные платформы, а также открыта для локального развертывания (лицензия MIT).
Благодаря своей универсальности и низкой цене, DeepSeek V3 подходит практически для любых задач:
Плюсы:
Минусы:
DeepSeek V3 стал невероятно популярным среди разработчиков благодаря своей открытости и дешевизне API. Вы можете использовать эту модель в следующих сервисах:
Опыт запуска DeepSeek V3 на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.32 / $0.89 за 1M токенов