От Mistral
Voxtral Small is an enhancement of Mistral Small 3, incorporating state-of-the-art audio input capabilities while retaining best-in-class text performance. It excels at speech transcription, translation and audio understanding. Input audio...
Voxtral Small 24B 2507 — это специализированная мультимодальная модель от Mistral AI, объединяющая в себе мощь текстового интеллекта Mistral Small 3 с передовыми возможностями обработки аудио. Представленная в октябре 2025 года, эта модель стала ответом на растущую потребность рынка в инструментах, способных напрямую «слышать» и понимать человеческую речь без промежуточных этапов преобразования.
В отличие от классических систем, использующих связку ASR (речь-в-текст) + LLM, Voxtral Small напрямую принимает аудиосигнал. Это позволяет модели улавливать не только слова, но и интонацию, эмоции и нюансы речи, что значительно повышает качество транскрибации и понимания контекста.
Благодаря глубокой интеграции аудио и текста, модель демонстрирует выдающиеся результаты в задачах перевода речи в реальном времени. Она способна мгновенно переводить аудио на одном языке в качественный текст на другом, сохраняя при этом смысл и эмоциональный окрас сообщения.
Voxtral Small может анализировать длинные аудиозаписи, выявлять в них ключевые моменты, определять количество спикеров и предоставлять краткие суммаризации обсуждений, что делает её идеальным инструментом для бизнеса.
| Бенчмарк | Результат Voxtral Small | Категория |
|---|---|---|
| Arena Elo | 1453 | Лидер аудио-текстовых моделей |
| MMLU | 89.4% | Общие знания |
| HumanEval | 81.3% | Написание кода |
| MATH | 86.3% | Математические рассуждения |
| GPQA | 71.5% | Научные тесты |
| SWE_bench | 45.7% | Решение инженерных задач |
Voxtral Small 24B доступна через API по цене $0.10 за 1M входных токенов. Это крайне выгодное предложение для разработчиков, внедряющих функции голосового управления и аудио-аналитики в свои приложения.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
Опыт запуска Voxtral Small 24B 2507 на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.10 / $0.30 за 1M токенов