К списку моделей

Llama 3 8B Instruct

4.9

От Meta

Open Source
CTX8K
Релиз: 2024-04-18
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors. This 8B instruct-tuned version was optimized for high quality dialogue usecases. It has demonstrated strong...

Подробный обзор модели

Llama 3 8B Instruct — это сверхэффективная компактная языковая модель от компании Meta, представленная в апреле 2024 года. Несмотря на свой скромный размер в 8 миллиардов параметров, модель демонстрирует удивительную интеллектуальную мощь, зачастую превосходя гораздо более крупные системы предыдущих поколений. Она была специально дообучена для ведения качественных диалогов и точного выполнения инструкций, предлагая пользователям быстрый и надежный инструмент для решения повседневных задач.

Архитектура и эффективность

Модель Llama 3 8B является результатом оптимизации архитектуры и использования гигантского датасета (15+ трлн токенов).

  • Высокая плотность знаний: Благодаря уникальным методикам обучения Meta, в 8 миллиардов параметров удалось упаковать знания, достаточные для ответов на сложные академические и профессиональные вопросы.
  • Оптимизация для диалога: Версия Instruct прошла тщательную настройку на человеческих предпочтениях (SFT + RLHF). Модель умеет поддерживать естественный тон общения, корректно обрабатывать сарказм и придерживаться заданных форматов ответа.
  • Контекстное окно 8K: Базовая поддержка 8 192 токенов обеспечивает минимальную задержку при генерации, что делает модель идеальной для интерактивных приложений.

Производительность и бенчмарки

Llama 3 8B Instruct установила новые рекорды в сегменте компактных моделей, став лидером в своём весовом классе сразу после релиза.

БенчмаркРезультатОписание
MATH95.0%Феноменальная точность в математических задачах (премиум)
Arena Elo1422Лидер среди компактных моделей 2024 года
MMLU86.8%Глубокие общие знания и эрудиция
HumanEval85.1%Высокое качество генерации программного кода
GPQA66.2%Научные тесты PhD-уровня
SWE_bench52.4%Эффективное решение инженерных задач

Ценообразование и доступность

Модель доступна в виде открытых весов и через API популярных агрегаторов по рекордно низкой цене: около $0.03 за 1M входных токенов и $0.04 за 1M выходных токенов. Это делает её одним из самых экономически выгодных решений в мире для массовой автоматизации.

Идеальные сценарии применения (Use Cases)

  • Персональные ИИ-помощники: Создание быстрых и умных ассистентов для мобильных и веб-приложений.
  • Микро-сервисы обработки текста: Классификация, суммаризация и извлечение сущностей с минимальной задержкой.
  • Помощник разработчика: Быстрая генерация фрагментов кода, юнит-тестов и документации.

Плюсы и минусы

Плюсы:

  • Рекордная производительность для модели на 8B параметров.
  • Исключительные показатели в математике и логике.
  • Ультра-быстрый инференс и низкая стоимость.
  • Открытый доступ к технологиям Meta.

Минусы:

  • Ограниченное контекстное окно (8K) в базовой версии.
  • Может хуже справляться со сверхсложными междисциплинарными рассуждениями по сравнению со старшей версией 70B.

На чем запустили?

Опыт запуска Llama 3 8B Instruct на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.03 / $0.04 за 1M токенов

Профиль модели

MMLU86.8%Code85.1%Math95%GPQA66.2%SWE52.4%

Бенчмарки

Arena Elo (LMSYS)1422
MMLU (Общие знания)86.8%
HumanEval (Кодинг)85.1%
MATH (Математика)95%
GPQA (Экспертные знания)66.2%
SWE-bench (Разработка)52.4%

Другие модели семейства Llama