К списку моделей

Llama 3.3 Nemotron Super 49B V1.5

4.9

От NVIDIA

Open Source
CTX131K
Релиз: 2025-10-10
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

Эффективная 49B-модель от NVIDIA, оптимизированная для агентских рабочих процессов и RAG. Сочетает точность уровня 70B с высокой пропускной способностью и поддержкой контекста 131K.

На чем запустили?

Опыт запуска Llama 3.3 Nemotron Super 49B V1.5 на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.10 / $0.40 за 1M токенов

Профиль модели

MMLU89.7%Code87.7%Math77.8%GPQA71.1%SWE51.5%

Бенчмарки

Arena Elo (LMSYS)1456
MMLU (Общие знания)89.7%
HumanEval (Кодинг)87.7%
MATH (Математика)77.8%
GPQA (Экспертные знания)71.1%
SWE-bench (Разработка)51.5%

Другие модели семейства Llama