От DeepSeek
DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across...
DeepSeek R1 Distill Llama 70B — это высокопроизводительная языковая модель с открытыми весами, представляющая собой результат глубокой дистилляции знаний из флагманской модели DeepSeek R1 в архитектуру Llama 3.3 70B Instruct. Представленная в январе 2025 года, эта модель объединяет в себе феноменальные способности к рассуждению (reasoning) от R1 с надежностью и эффективностью популярного семейства Llama, предлагая пользователям интеллект уровня o1-preview в компактном и быстром 70B формате.
Модель была создана командой DeepSeek путем обучения Llama 3.3 70B на огромном массиве данных, включающем «цепочки мыслей» (thinking traces), сгенерированные флагманской моделью DeepSeek R1.
Модель уверенно занимает топовые позиции в рейтингах систем среднего веса, соревнуясь с лучшими закрытыми аналогами в точности логического вывода.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MATH | 91.3% | Исключительная точность в математических рассуждениях (премиум) |
| Arena Elo | 1405 | Высокий профессиональный уровень |
| HumanEval | 86.4% | Высокое качество генерации программного кода |
| MMLU | 85.4% | Глубокие общие знания и эрудиция |
| GPQA | 69.3% | Научные вопросы PhD-уровня |
| SWE_bench | 58.1% | Решение инженерных задач в реальных условиях |
Модель доступна в виде открытых весов и через API популярных агрегаторов (например, OpenRouter) по крайне привлекательной цене: всего $0.70 за 1M входных токенов и $0.80 за 1M выходных токенов. Это делает её одним из самых выгодных решений для систем, требующих глубокого рассуждения за минимальную стоимость.
Плюсы:
Минусы:
Опыт запуска R1 Distill Llama 70B на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.70 / $0.80 за 1M токенов