К списку моделей

Llama 3 70B Instruct

4.2

От Meta

Open Source
CTX8K
Релиз: 2024-04-18
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors. This 70B instruct-tuned version was optimized for high quality dialogue usecases. It has demonstrated strong...

Подробный обзор модели

Llama 3 70B Instruct — это высокопроизводительная языковая модель флагманского уровня от компании Meta, представленная в апреле 2024 года. С 70 миллиардами параметров, эта модель совершила качественный прорыв в области открытого ИИ, предлагая возможности, сопоставимые с лучшими проприетарными системами. Модель была специально дообучена для ведения высококачественных диалогов, точного следования инструкциям и решения сложных логических задач.

Архитектура и интеллектуальное превосходство

Llama 3 70B является результатом масштабного обучения на датасете объемом более 15 триллионов токенов, что в 7 раз больше, чем у предыдущего поколения.

  • Мастерство диалога: Версия Instruct прошла глубокую процедуру настройки (SFT) и усиленного обучения на основе обратной связи (RLHF). Модель демонстрирует исключительную точность в понимании контекста, умеет поддерживать заданную роль и предоставляет вежливые и аргументированные ответы.
  • Программная эрудиция: Благодаря значительному увеличению доли кода в обучающих данных, Llama 3 70B стала полноценным инструментом для разработчиков, показывая высокие результаты в генерации и аудите программного обеспечения.
  • Контекстное окно 8K: В базовой версии модель поддерживает 8 192 токена, что оптимизировано для высокой скорости ответа и эффективности в повседневных диалоговых сценариях.

Производительность и бенчмарки

Llama 3 70B установила новые стандарты для моделей своего класса, уверенно опережая конкурентов в тестах на общие знания и рассуждения.

БенчмаркРезультатОписание
Arena Elo1422Топ-уровень мировых флагманов 2024 года
MMLU86.8%Глубокие общие знания и эрудиция
HumanEval81.2%Высокое качество генерации программного кода
MATH79.9%Хорошие математические способности и логика
GPQA69.0%Научные вопросы PhD-уровня
SWE_bench52.9%Решение инженерных задач

Ценообразование и доступность

Llama 3 70B Instruct доступна в виде открытых весов и через API популярных агрегаторов (например, OpenRouter) по крайне выгодной цене: около $0.51 за 1M входных токенов и $0.74 за 1M выходных токенов. Это одно из самых привлекательных предложений на рынке по соотношению «интеллект/стоимость».

Идеальные сценарии применения (Use Cases)

  • Интеллектуальные ассистенты высшего уровня: Создание надежных виртуальных помощников для бизнеса и частных пользователей.
  • Профессиональный копирайтинг и контент: Генерация качественных текстов, перевод и адаптация материалов.
  • Сложный RAG и поиск: Использование в качестве ядра систем ответов на вопросы по базам знаний.

Плюсы и минусы

Плюсы:

  • Флагманский уровень интеллекта при открытых весах.
  • Исключительная точность следования инструкциям.
  • Отличное понимание программирования и логики.
  • Очень выгодная стоимость API.

Минусы:

  • Ограниченное контекстное окно (8K) в базовой реализации.
  • Требует значительных мощностей для эффективного локального запуска.

На чем запустили?

Опыт запуска Llama 3 70B Instruct на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.51 / $0.74 за 1M токенов

Профиль модели

MMLU86.8%Code81.2%Math79.9%GPQA69%SWE52.9%

Бенчмарки

Arena Elo (LMSYS)1422
MMLU (Общие знания)86.8%
HumanEval (Кодинг)81.2%
MATH (Математика)79.9%
GPQA (Экспертные знания)69%
SWE-bench (Разработка)52.9%

Другие модели семейства Llama