К списку моделей

Mixtral 8x22B Instruct

4.0

От Mistral

Open Source
CTX66K
Релиз: 2024-04-17
StandardGeneralTextОткрытые веса
Официальный сайт

Краткое описание

Mistral's official instruct fine-tuned version of [Mixtral 8x22B](/models/mistralai/mixtral-8x22b). It uses 39B active parameters out of 141B, offering unparalleled cost efficiency for its size. Its strengths include: - strong math, coding,...

Подробный обзор модели

Обзор Mixtral 8x22B Instruct: Мощь Mixture-of-Experts для профессионалов (2026)

Mixtral 8x22B Instruct, представленная французской компанией Mistral AI в апреле 2024 года, является одной из самых мощных и эффективных открытых моделей в мире. Используя архитектуру разреженного смешения экспертов (Sparse Mixture-of-Experts), она обеспечивает интеллект уровня флагманских закрытых нейросетей, оставаясь при этом экономически выгодной и быстрой в работе.

Архитектура: Разумная эффективность 141 миллиарда параметров

Главная особенность Mixtral 8x22B — её уникальное строение. Несмотря на то, что общее число параметров составляет 141 миллиард, модель работает по принципу динамического распределения ресурсов.

  • Активные параметры: Для обработки каждого отдельного токена (слова) активируются только 2 из 8 «экспертов», что составляет около 39 миллиардов параметров. Это позволяет модели обладать знаниями гиганта, но сохранять скорость работы модели среднего размера.
  • Контекстное окно 64K: Поддержка 64 000 токенов (согласно данным API) позволяет эффективно анализировать длинные документы, технические спецификации и проводить глубокие диалоги без потери нити рассуждения.
  • Полная открытость: Модель распространяется под лицензией Apache 2.0, что дает полную свободу для коммерческого использования, дообучения (fine-tuning) и развертывания в закрытых корпоративных контурах.

Производительность и бенчмарки

Mixtral 8x22B Instruct была специально обучена следовать сложным инструкциям и демонстрирует выдающиеся результаты в математике и программировании.

БенчмаркРезультат Mixtral 8x22BОписание
Arena Elo1381Уровень ведущих мировых моделей
HumanEval85.8%Исключительное мастерство кодинга
MMLU83.4%Глубокая академическая эрудиция
MATH69.8%Сильные логические рассуждения
GPQA61.6%Научные вопросы уровня PhD
SWE_bench51.4%Автономное решение инженерных задач

Модель особенно сильна в генерации чистого, оптимизированного кода и понимании сложных многоязычных запросов.

Экономика и доступность API

Благодаря MoE-архитектуре, стоимость использования Mixtral 8x22B через облачные API остается очень конкурентной:

  • $2.00 за 1M входных токенов
  • $6.00 за 1M выходных токенов

Это делает её идеальным выбором для задач, где требуется высокая точность и большой объем генерации, но бюджет ограничен.

Идеальные сценарии применения

  • Корпоративная разработка: Написание кода, аудит безопасности и создание технической документации.
  • Сложный RAG: Интеллектуальный поиск в больших массивах данных благодаря 64K контексту.
  • Многоязычные системы: Создание глобальных ассистентов с поддержкой английского, французского, немецкого, испанского и итальянского языков на нативном уровне.
  • Batch-обработка: Быстрая классификация и извлечение данных из огромных массивов текста благодаря высокой пропускной способности MoE.

Плюсы и минусы

Плюсы:

  • Лучшее соотношение скорости и интеллекта в классе 100B+.
  • Полностью открытая лицензия Apache 2.0.
  • Высокая точность в задачах программирования (HumanEval 85.8%).
  • Нативная поддержка многих европейских языков.

Минусы:

  • Требует значительных GPU-мощностей для локального запуска (минимум 80GB-100GB VRAM даже с квантованием).
  • Контекстное окно в 64K меньше, чем у обновленной серии Llama 3.1/3.3.

На чем запустили?

Опыт запуска Mixtral 8x22B Instruct на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$2.00 / $6.00 за 1M токенов

Профиль модели

MMLU83.4%Code85.8%Math69.8%GPQA61.6%SWE51.4%

Бенчмарки

Arena Elo (LMSYS)1381
MMLU (Общие знания)83.4%
HumanEval (Кодинг)85.8%
MATH (Математика)69.8%
GPQA (Экспертные знания)61.6%
SWE-bench (Разработка)51.4%

Другие модели семейства Mistral