NVIDIA Nemotron 3 Super — гибридная MoE-модель на 120B параметров (12B активных), объединяющая архитектуры Mamba-2 и Transformer. Оптимизирована для агентных систем, поддерживает контекст 1M токенов и нативную спекулятивную декодировку. Результат MMLU — 88,7%.
$0.09 / $0.45 за 1M токенов