От Mistral
A 12B parameter model with a 128k token context length built by Mistral in collaboration with NVIDIA. The model is multilingual, supporting English, French, German, Spanish, Italian, Portuguese, Chinese, Japanese,...
Обзор Mistral NeMo 12B: Идеальный баланс между мощностью и мобильностью (2026)
Mistral NeMo 12B, выпущенная в июле 2024 года, стала результатом стратегического партнерства между Mistral AI и NVIDIA. Эта модель была спроектирована как высокопроизводительная замена оригинальной Mistral 7B, предлагая значительно больше возможностей в компактном форм-факторе, который все еще можно запустить на домашнем оборудовании.
Mistral NeMo 12B — это не просто увеличенная версия предыдущих моделей. Она вобрала в себя ряд технических инноваций, оптимизирующих её для работы на современных GPU.
Благодаря 12 миллиардам параметров, Mistral NeMo уверенно обходит популярные модели меньшего размера, такие как Llama 3 8B, особенно в задачах рассуждения и программирования.
| Бенчмарк | Результат Mistral NeMo | Категория |
|---|---|---|
| Arena Elo | 1383 | Общий интеллект |
| MMLU | 83.6% | Академические знания |
| HumanEval | 81.4% | Написание кода |
| MATH | 87.6% | Математическая логика |
| SWE_bench | 54.6% | Автономная инженерия |
| GPQA | 63.4% | Научный анализ |
Модель демонстрирует отличные результаты в многоязычных сценариях, особенно на европейских языках, что делает её универсальным инструментом для глобальных задач.
Партнерство с NVIDIA позволило сделать Mistral NeMo одной из самых дешевых моделей для промышленного использования:
Это делает стоимость инференса практически незаметной даже при обработке гигантских массивов данных, что идеально подходит для стартапов и массовых сервисов.
Плюсы:
Минусы:
Опыт запуска Mistral Nemo на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.02 / $0.03 за 1M токенов