От Meta
Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors. This 70B instruct-tuned version was optimized for high quality dialogue usecases. It has demonstrated strong...
Llama 3 70B Instruct — это высокопроизводительная языковая модель флагманского уровня от компании Meta, представленная в апреле 2024 года. С 70 миллиардами параметров, эта модель совершила качественный прорыв в области открытого ИИ, предлагая возможности, сопоставимые с лучшими проприетарными системами. Модель была специально дообучена для ведения высококачественных диалогов, точного следования инструкциям и решения сложных логических задач.
Llama 3 70B является результатом масштабного обучения на датасете объемом более 15 триллионов токенов, что в 7 раз больше, чем у предыдущего поколения.
Llama 3 70B установила новые стандарты для моделей своего класса, уверенно опережая конкурентов в тестах на общие знания и рассуждения.
| Бенчмарк | Результат | Описание |
|---|---|---|
| Arena Elo | 1422 | Топ-уровень мировых флагманов 2024 года |
| MMLU | 86.8% | Глубокие общие знания и эрудиция |
| HumanEval | 81.2% | Высокое качество генерации программного кода |
| MATH | 79.9% | Хорошие математические способности и логика |
| GPQA | 69.0% | Научные вопросы PhD-уровня |
| SWE_bench | 52.9% | Решение инженерных задач |
Llama 3 70B Instruct доступна в виде открытых весов и через API популярных агрегаторов (например, OpenRouter) по крайне выгодной цене: около $0.51 за 1M входных токенов и $0.74 за 1M выходных токенов. Это одно из самых привлекательных предложений на рынке по соотношению «интеллект/стоимость».
Плюсы:
Минусы:
Опыт запуска Llama 3 70B Instruct на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.51 / $0.74 за 1M токенов