К списку моделей

Mistral Small 3

4.2

От Mistral

Open Source
CTX33K
Релиз: 2025-01-30
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

Mistral Small 3 is a 24B-parameter language model optimized for low-latency performance across common AI tasks. Released under the Apache 2.0 license, it features both pre-trained and instruction-tuned versions designed...

Подробный обзор модели

Обзор Mistral Small 3 (24B): Король эффективности и скорости (2026)

Mistral Small 3 (версия 2501), выпущенная в январе 2025 года, представляет собой флагманское решение компании Mistral AI в сегменте компактных, но мощных моделей. С 24 миллиардами параметров эта модель устанавливает новые стандарты производительности на ватт, предлагая интеллект уровня гораздо более крупных нейросетей при экстремально низкой задержке (latency).

Архитектура и техническое превосходство

Mistral Small 3 была разработана с фокусом на эффективность и реальную пользу в рабочих процессах.

  • Оптимальный размер 24B: Этот объем параметров позволяет модели работать на потребительских GPU с высокой скоростью, обеспечивая при этом глубокое понимание контекста и логики.
  • Apache 2.0 Лицензия: Модель полностью открыта для коммерческого использования и модификации, что делает её идеальным выбором для встраивания в частные и корпоративные продукты.
  • Контекстное окно 33K: Хотя окно контекста скромнее, чем у некоторых флагманов, оно полностью оптимизировано для работы без потери качества (no "lost in the middle"), что идеально подходит для чат-ботов и быстрых RAG-систем.

Производительность и бенчмарки

Несмотря на свой размер, Mistral Small 3 показывает феноменальные результаты, особенно в математике и кодинге.

БенчмаркРезультат Mistral Small 3Категория
Arena Elo1394Уровень топовых 70B+ моделей
MATH93.4%Исключительная математическая точность
MMLU84.5%Глубокие академические знания
HumanEval84.8%Высокое мастерство программирования
GPQA68.3%Научный анализ экспертного уровня
SWE_bench49.6%Автономное решение инженерных задач

Результаты в тесте MATH (93.4%) ставят эту модель в один ряд с лидерами индустрии, делая её незаменимой для аналитических и технических расчетов.

Рекордно низкая стоимость API

Mistral Small 3 предлагает одну из самых низких цен в индустрии за уровень интеллекта «Small SOTA»:

  • $0.05 за 1M входных токенов
  • $0.08 за 1M выходных токенов

Такая стоимость позволяет использовать модель для массовой обработки данных, где важна каждая доля цента, без ущерба для качества результатов.

Идеальные сценарии применения

  • Low-Latency ассистенты: Создание мгновенно отвечающих чат-ботов и голосовых помощников.
  • Математика и аналитика: Решение сложных вычислительных задач и логический анализ данных.
  • Кодинг-инструменты: Быстрая автодополнение кода и генерация тестов в реальном времени.
  • Предварительная обработка данных: Классификация, извлечение сущностей и саммаризация огромных массивов текста.

Плюсы и минусы

Плюсы:

  • Невероятная математическая точность для модели такого размера.
  • Экстремально низкая стоимость и высокая скорость работы.
  • Открытая лицензия Apache 2.0.
  • Баланс характеристик, позволяющий конкурировать с моделями в 2-3 раза больше.

Минусы:

  • Относительно небольшое контекстное окно (32K+).
  • В длинных творческих текстах может быть менее выразительной, чем Mistral Large.

На чем запустили?

Опыт запуска Mistral Small 3 на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.05 / $0.08 за 1M токенов

Профиль модели

MMLU84.5%Code84.8%Math93.4%GPQA68.3%SWE49.6%

Бенчмарки

Arena Elo (LMSYS)1394
MMLU (Общие знания)84.5%
HumanEval (Кодинг)84.8%
MATH (Математика)93.4%
GPQA (Экспертные знания)68.3%
SWE-bench (Разработка)49.6%

Другие модели семейства Mistral