От Meta
Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors. This 8B instruct-tuned version was optimized for high quality dialogue usecases. It has demonstrated strong...
Llama 3 8B Instruct — это сверхэффективная компактная языковая модель от компании Meta, представленная в апреле 2024 года. Несмотря на свой скромный размер в 8 миллиардов параметров, модель демонстрирует удивительную интеллектуальную мощь, зачастую превосходя гораздо более крупные системы предыдущих поколений. Она была специально дообучена для ведения качественных диалогов и точного выполнения инструкций, предлагая пользователям быстрый и надежный инструмент для решения повседневных задач.
Модель Llama 3 8B является результатом оптимизации архитектуры и использования гигантского датасета (15+ трлн токенов).
Llama 3 8B Instruct установила новые рекорды в сегменте компактных моделей, став лидером в своём весовом классе сразу после релиза.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MATH | 95.0% | Феноменальная точность в математических задачах (премиум) |
| Arena Elo | 1422 | Лидер среди компактных моделей 2024 года |
| MMLU | 86.8% | Глубокие общие знания и эрудиция |
| HumanEval | 85.1% | Высокое качество генерации программного кода |
| GPQA | 66.2% | Научные тесты PhD-уровня |
| SWE_bench | 52.4% | Эффективное решение инженерных задач |
Модель доступна в виде открытых весов и через API популярных агрегаторов по рекордно низкой цене: около $0.03 за 1M входных токенов и $0.04 за 1M выходных токенов. Это делает её одним из самых экономически выгодных решений в мире для массовой автоматизации.
Плюсы:
Минусы:
Опыт запуска Llama 3 8B Instruct на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.03 / $0.04 за 1M токенов