От NVIDIA
Эффективная 49B-модель от NVIDIA, оптимизированная для агентских рабочих процессов и RAG. Сочетает точность уровня 70B с высокой пропускной способностью и поддержкой контекста 131K.
Опыт запуска Llama 3.3 Nemotron Super 49B V1.5 на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.10 / $0.40 за 1M токенов