От Mistral
Devstral Medium is a high-performance code generation and agentic reasoning model developed jointly by Mistral AI and All Hands AI. Positioned as a step up from Devstral Small, it achieves...
Devstral Medium — это высокопроизводительная языковая модель, специально разработанная для программирования и агентных рассуждений совместными усилиями Mistral AI и All Hands AI. Представленная в июле 2025 года, она является развитием идей Devstral Small, предлагая значительно более глубокое понимание архитектуры ПО и сложных инженерных взаимосвязей.
В отличие от универсальных моделей, Devstral Medium прошла узкоспециализированное обучение на огромных массивах профессионального кода, логов ошибок и технической документации. Она обладает "инженерным складом ума", что позволяет ей предлагать более идиоматичные и безопасные решения в разработке ПО.
Модель была оптимизирована для работы в составе ИИ-агентов. Она отлично справляется с пошаговым планированием задач, автономным поиском ошибок в нескольких файлах одновременно и принятием решений на основе результатов тестирования.
Поддержка контекстного окна в 128 000+ токенов позволяет модели удерживать в памяти архитектурные схемы целых проектов. Это критически важно для корректного рефакторинга и понимания того, как локальные изменения в коде повлияют на работоспособность всей системы.
| Бенчмарк | Результат Devstral Medium | Категория |
|---|---|---|
| Arena Elo | 1452 | Лидер инженерных моделей |
| MMLU | 89.3% | Общие знания |
| HumanEval | 88.8% | Написание кода |
| MATH | 95.1% | Математика и логика |
| GPQA | 69.9% | Научные вопросы |
| SWE_bench | 51.0% | Решение инженерных задач |
Devstral Medium доступна через API по цене $0.40 за 1M входных токенов. Это крайне выгодное предложение для специализированной инженерной модели такого уровня, позволяющее значительно повысить продуктивность команд разработки при разумных затратах.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
Опыт запуска Devstral Medium на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.40 / $2.00 за 1M токенов