От Mistral
Mistral Large 3 2512 is Mistral’s most capable model to date, featuring a sparse mixture-of-experts architecture with 41B active parameters (675B total), and released under the Apache 2.0 license.
Mistral Large 3 (версия 2512), выпущенная в конце 2025 года, закрепила за Mistral AI статус лидера в сегменте открытых моделей для крупного бизнеса. Это модель, созданная для работы в закрытых корпоративных контурах, где важна безопасность и полный контроль над весами.
Модель использует современную разреженную архитектуру (Sparse MoE) с общим количеством параметров в 675 миллиардов, из которых для каждого запроса активируется около 41 миллиарда.
Mistral Large 3 показывает стабильно высокие результаты в мультиязычных тестах и понимании длинных текстов.
| Бенчмарк | Показатель | Контекст |
|---|---|---|
| MMLU (8 языков) | 85.5% | Общая эрудиция на разных языках |
| MMLU Pro | 69.7% | Сложные технические вопросы |
| MATH 500 | 73.6% | Математическая логика |
| GPQA Diamond | 48.6% | Научное мышление |
Mistral Large 3 доступна как для скачивания (Hugging Face), так и через API La Plateforme.
Плюсы:
Минусы:
Опыт запуска Mistral Large 3 2512 на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.50 / $1.50 за 1M токенов