К списку моделей

Llama 3.1 8B Instruct

4.3

От Meta

Open Source
CTX16K
Релиз: 2024-07-23
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

Llama 3.1 8B Instruct — высокоскоростная модель от Meta с контекстным окном 128K. Оптимизирована для диалогов и RAG-задач. Цена $0.02/$0.05 за 1 млн токенов. Отличное решение для локального запуска и чат-ботов.

На чем запустили?

Опыт запуска Llama 3.1 8B Instruct на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.02 / $0.05 за 1M токенов

Профиль модели

MMLU83.4%Code77.7%Math76.4%GPQA58.8%SWE51.7%

Бенчмарки

Arena Elo (LMSYS)1381
MMLU (Общие знания)83.4%
HumanEval (Кодинг)77.7%
MATH (Математика)76.4%
GPQA (Экспертные знания)58.8%
SWE-bench (Разработка)51.7%

Другие модели семейства Llama