Name: Mistral Nemo
Author: Mistral

Краткое описание

Модель с параметрами 12B и длиной контекста токена 128 тыс., созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычная, поддерживает английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский,...

Агрегированный профиль

Mistral Nemo сильнее всего выглядит в категории «код». Индекс 38/100 рассчитан по процентильным позициям в 2 сопоставимых тестах; уверенность — средняя. Это навигационная оценка, а не замена тесту на ваших задачах.

Код38/100

2 сопоставимых теста · уверенность: средняя

Рассуждения38/100

3 сопоставимых теста · уверенность: средняя

Как рассчитан профиль →

Место модели в каталоге

Позиция рассчитана только среди моделей, для которых в каталоге указан результат того же теста. Это помогает сравнивать карточки, но не заменяет проверку модели на вашей задаче.

Бенчмарк	Результат	Место	Доказательство
Arena Elo (LMSYS)	1383	302 из 384	Источник не указан
MMLU (Общие знания)	83.6%	304 из 391	Источник не указан
HumanEval (Кодинг)	81.4%	294 из 391	Источник не указан
MATH (Математика)	87.6%	149 из 391	Источник не указан
GPQA (Экспертные знания)	63.4%	272 из 390	Источник не указан
SWE-bench (Разработка)	54.6%	183 из 381	Источник не указан

Подробный обзор модели

Обзор Mistral NeMo 12B: Идеальный баланс между мощностью и мобильностью (2026)

Mistral NeMo 12B, выпущенная в июле 2024 года, стала результатом стратегического партнерства между Mistral AI и NVIDIA. Эта модель была спроектирована как высокопроизводительная замена оригинальной Mistral 7B, предлагая значительно больше возможностей в компактном форм-факторе, который все еще можно запустить на домашнем оборудовании.

Архитектура и совместные инновации с NVIDIA

Mistral NeMo 12B — это не просто увеличенная версия предыдущих моделей. Она вобрала в себя ряд технических инноваций, оптимизирующих её для работы на современных GPU.

Новый токенизатор Tekken: Использование Tiktoken-базированного токенизатора, обученного на более чем 100 языках, сделало сжатие текста и кода на 30% эффективнее по сравнению с предыдущими решениями Mistral.
Оптимизация под FP8: Модель изначально обучалась с учетом квантования, что позволяет запускать её в режиме FP8 без потери точности, значительно экономя видеопамять.
Контекстное окно 128K: Поддержка 128 000 токенов (из API) ставит NeMo в один ряд с флагманскими моделями, позволяя ей «проглатывать» целые технические руководства или объемные кодовые базы.

Производительность и бенчмарки

Благодаря 12 миллиардам параметров, Mistral NeMo уверенно обходит популярные модели меньшего размера, такие как Llama 3 8B, особенно в задачах рассуждения и программирования.

Бенчмарк	Результат Mistral NeMo	Категория
Arena Elo	1383	Общий интеллект
MMLU	83.6%	Академические знания
HumanEval	81.4%	Написание кода
MATH	87.6%	Математическая логика
SWE_bench	54.6%	Автономная инженерия
GPQA	63.4%	Научный анализ

Модель демонстрирует отличные результаты в многоязычных сценариях, особенно на европейских языках, что делает её универсальным инструментом для глобальных задач.

Доступность и рекордные цены API

Партнерство с NVIDIA позволило сделать Mistral NeMo одной из самых дешевых моделей для промышленного использования:

$0.02 за 1M входных токенов
$0.03 за 1M выходных токенов

Это делает стоимость инференса практически незаметной даже при обработке гигантских массивов данных, что идеально подходит для стартапов и массовых сервисов.

Идеальные сценарии применения

Локальный RAG: Благодаря окну в 128K и компактному размеру, это лучшая модель для персональных баз знаний на RTX 4090.
Многоязычные чат-боты: Высокое качество ответов на европейских языках и высокая скорость генерации.
Анализ длинных документов: Саммаризация и поиск информации в книгах и отчетах.
Экономичная разработка: Использование в качестве первого слоя фильтрации или генерации простых скриптов в CI/CD пайплайнах.

Плюсы и минусы

Плюсы:

Феноменальная производительность для модели такого размера.
Огромное контекстное окно (128K).
Полная оптимизация под инфраструктуру NVIDIA (TensorRT-LLM).
Сверхнизкая стоимость API.

Минусы:

Для использования полного контекста 128K всё же требуется значительный объем VRAM (более 24GB).
В очень сложных логических задачах может уступать более тяжелым моделям (70B+).

Экосистема Mistral Nemo

Сервисы, инструменты, материалы и обсуждения, связанные с моделью.

Сервисы с поддержкой модели

Откройте результаты по названию модели и проверьте актуальную интеграцию.

Искать в /services/ →

Обсуждения о Mistral Nemo

Задайте вопрос сообществу — карточка модели будет прикреплена автоматически.

Создать обсуждение

Mistral Nemo

Краткое описание

Агрегированный профиль

Место модели в каталоге

Подробный обзор модели

Архитектура и совместные инновации с NVIDIA

Производительность и бенчмарки

Доступность и рекордные цены API

Идеальные сценарии применения

Плюсы и минусы

Где запустить модель

Стоимость API

Профиль модели

Бенчмарки

Другие модели семейства Mistral

Экосистема Mistral Nemo

Сервисы с поддержкой модели

MCP и инструменты

Статьи и термины

Обсуждения о Mistral Nemo