К списку моделей

Llama 3.2 3B Instruct

4.9

От Meta

Open Source
CTX80K
Релиз: 2024-09-25
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization. Designed with the latest transformer architecture, it...

На чем запустили?

Опыт запуска Llama 3.2 3B Instruct на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.05 / $0.34 за 1M токенов

Профиль модели

MMLU84.3%Code84%Math89.4%GPQA59.8%SWE49.3%

Бенчмарки

Arena Elo (LMSYS)1392
MMLU (Общие знания)84.3%
HumanEval (Кодинг)84%
MATH (Математика)89.4%
GPQA (Экспертные знания)59.8%
SWE-bench (Разработка)49.3%

Другие модели семейства Llama