К списку моделей

Voxtral Small 24B 2507

4.0

От Mistral

Open Source
CTX32K
Релиз: 2025-10-30
StandardGeneralTextОткрытые веса
Официальный сайт

Краткое описание

Voxtral Small is an enhancement of Mistral Small 3, incorporating state-of-the-art audio input capabilities while retaining best-in-class text performance. It excels at speech transcription, translation and audio understanding. Input audio...

Подробный обзор модели

Обзор Voxtral Small 24B 2507: Слух и разум от Mistral (2026)

Voxtral Small 24B 2507 — это специализированная мультимодальная модель от Mistral AI, объединяющая в себе мощь текстового интеллекта Mistral Small 3 с передовыми возможностями обработки аудио. Представленная в октябре 2025 года, эта модель стала ответом на растущую потребность рынка в инструментах, способных напрямую «слышать» и понимать человеческую речь без промежуточных этапов преобразования.

Уникальность Voxtral Small

1. Нативная обработка аудио

В отличие от классических систем, использующих связку ASR (речь-в-текст) + LLM, Voxtral Small напрямую принимает аудиосигнал. Это позволяет модели улавливать не только слова, но и интонацию, эмоции и нюансы речи, что значительно повышает качество транскрибации и понимания контекста.

2. Мастер синхронного перевода

Благодаря глубокой интеграции аудио и текста, модель демонстрирует выдающиеся результаты в задачах перевода речи в реальном времени. Она способна мгновенно переводить аудио на одном языке в качественный текст на другом, сохраняя при этом смысл и эмоциональный окрас сообщения.

3. Интеллектуальное аудио-сопоставление

Voxtral Small может анализировать длинные аудиозаписи, выявлять в них ключевые моменты, определять количество спикеров и предоставлять краткие суммаризации обсуждений, что делает её идеальным инструментом для бизнеса.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат Voxtral SmallКатегория
Arena Elo1453Лидер аудио-текстовых моделей
MMLU89.4%Общие знания
HumanEval81.3%Написание кода
MATH86.3%Математические рассуждения
GPQA71.5%Научные тесты
SWE_bench45.7%Решение инженерных задач

Сценарии использования

  • Автоматическая транскрибация встреч: Создание точных протоколов совещаний с учетом интонаций и разделением по спикерам.
  • Интеллектуальные IVR и колл-центры: Создание голосовых помощников нового поколения, способных понимать сложные запросы клиентов «на слух».
  • Инструменты для обучения языкам: Анализ произношения пользователей и предоставление обратной связи в реальном времени.

Доступность и цена

Voxtral Small 24B доступна через API по цене $0.10 за 1M входных токенов. Это крайне выгодное предложение для разработчиков, внедряющих функции голосового управления и аудио-аналитики в свои приложения.


Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

На чем запустили?

Опыт запуска Voxtral Small 24B 2507 на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.10 / $0.30 за 1M токенов

Профиль модели

MMLU89.4%Code81.3%Math86.3%GPQA71.5%SWE45.7%

Бенчмарки

Arena Elo (LMSYS)1453
MMLU (Общие знания)89.4%
HumanEval (Кодинг)81.3%
MATH (Математика)86.3%
GPQA (Экспертные знания)71.5%
SWE-bench (Разработка)45.7%

Другие модели семейства Mistral