К списку моделей

Llama 3.1 Nemotron 70B Instruct

4.7

От NVIDIA

Open Source
CTX131K
Релиз: 2024-10-15
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

NVIDIA's Llama 3.1 Nemotron 70B is a language model designed for generating precise and useful responses. Leveraging [Llama 3.1 70B](/models/meta-llama/llama-3.1-70b-instruct) architecture and Reinforcement Learning from Human Feedback (RLHF), it excels...

На чем запустили?

Опыт запуска Llama 3.1 Nemotron 70B Instruct на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$1.20 / $1.20 за 1M токенов

Профиль модели

MMLU87.4%Code90.9%Math78%GPQA66.4%SWE58.4%

Бенчмарки

Arena Elo (LMSYS)1429
MMLU (Общие знания)87.4%
HumanEval (Кодинг)90.9%
MATH (Математика)78%
GPQA (Экспертные знания)66.4%
SWE-bench (Разработка)58.4%

Другие модели семейства Llama