К списку моделей

R1 Distill Llama 70B

4.5

От DeepSeek

Open Source
CTX131K
Релиз: 2025-01-23
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across...

Подробный обзор модели

DeepSeek R1 Distill Llama 70B — это высокопроизводительная языковая модель с открытыми весами, представляющая собой результат глубокой дистилляции знаний из флагманской модели DeepSeek R1 в архитектуру Llama 3.3 70B Instruct. Представленная в январе 2025 года, эта модель объединяет в себе феноменальные способности к рассуждению (reasoning) от R1 с надежностью и эффективностью популярного семейства Llama, предлагая пользователям интеллект уровня o1-preview в компактном и быстром 70B формате.

Особенности и метод дистилляции

Модель была создана командой DeepSeek путем обучения Llama 3.3 70B на огромном массиве данных, включающем «цепочки мыслей» (thinking traces), сгенерированные флагманской моделью DeepSeek R1.

  • Интеллектуальный прорыв в 70B: Благодаря дистилляции, модель получила способности к пошаговому анализу сложных задач, которые ранее были доступны только гигантским моделям на 600B+ параметров. Она умеет проводить внутреннюю верификацию ответов и находить неочевидные решения.
  • Мастерство математики и логики: DeepSeek R1 Distill Llama 70B демонстрирует выдающиеся результаты в STEM-дисциплинах, значительно превосходя базовую Llama 3.3 в задачах на логический вывод и математическое моделирование.
  • Эффективный инференс: Размер в 70 миллиардов параметров позволяет модели работать быстро и эффективно на современных GPU-кластерах, обеспечивая отличный баланс между глубиной рассуждений и скоростью генерации.

Производительность и бенчмарки

Модель уверенно занимает топовые позиции в рейтингах систем среднего веса, соревнуясь с лучшими закрытыми аналогами в точности логического вывода.

БенчмаркРезультатОписание
MATH91.3%Исключительная точность в математических рассуждениях (премиум)
Arena Elo1405Высокий профессиональный уровень
HumanEval86.4%Высокое качество генерации программного кода
MMLU85.4%Глубокие общие знания и эрудиция
GPQA69.3%Научные вопросы PhD-уровня
SWE_bench58.1%Решение инженерных задач в реальных условиях

Ценообразование и доступность

Модель доступна в виде открытых весов и через API популярных агрегаторов (например, OpenRouter) по крайне привлекательной цене: всего $0.70 за 1M входных токенов и $0.80 за 1M выходных токенов. Это делает её одним из самых выгодных решений для систем, требующих глубокого рассуждения за минимальную стоимость.

Идеальные сценарии применения (Use Cases)

  • Глубокие научные и технические исследования: Помощь в анализе данных, проверке гипотез и решении сложных уравнений.
  • Профессиональный кодинг и аудит: Использование способностей к рассуждению для отладки сложной логики и проектирования систем.
  • Интеллектуальные RAG-системы: Построение надежных систем ответов на вопросы, требующих пошагового анализа предоставленного контекста.

Плюсы и минусы

Плюсы:

  • Интеллект «рассуждающих» флагманов в 70B формате.
  • Феноменальная точность в математике и логике.
  • Открытые веса (база Llama 3.3).
  • Очень выгодная стоимость API.

Минусы:

  • Требует значительных мощностей для локального запуска.
  • Цепочки мыслей модели могут быть менее подробными, чем у оригинальной DeepSeek R1 671B.

На чем запустили?

Опыт запуска R1 Distill Llama 70B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.70 / $0.80 за 1M токенов

Профиль модели

MMLU85.4%Code86.4%Math91.3%GPQA69.3%SWE58.1%

Бенчмарки

Arena Elo (LMSYS)1405
MMLU (Общие знания)85.4%
HumanEval (Кодинг)86.4%
MATH (Математика)91.3%
GPQA (Экспертные знания)69.3%
SWE-bench (Разработка)58.1%

Другие модели семейства DeepSeek