От Meta
Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input...
Llama 4 Scout, выпущенная Meta в апреле 2025 года, стала первой моделью в долгожданном четвертом поколении семейства Llama. Это экспериментальная и мощная MoE-модель (Mixture-of-Experts), которая служит «разведчиком» для будущих полноразмерных флагманов, предлагая нативную мультимодальность и рекордную для открытых моделей эффективность.
Meta впервые применила архитектуру Mixture-of-Experts в основной линейке Llama. Со 109 миллиардами параметров, из которых только 17 миллиардов активны при каждом запросе, модель Scout обеспечивает производительность уровня Llama 3 70B при скорости и стоимости работы маленьких моделей.
В отличие от предыдущих версий, где зрение добавлялось через адаптеры, Llama 4 Scout была обучена как мультимодальная система с первого дня. Это обеспечивает бесшовную интеграцию текстовых и визуальных данных, позволяя модели «видеть» и «рассуждать» о мире в реальном времени.
С окном контекста в 328 000 токенов, Scout может обрабатывать целые книги, обширные кодовые базы и длинные транскрипции видео без потери фокуса на деталях.
| Бенчмарк | Результат Llama 4 Scout | Категория |
|---|---|---|
| Arena Elo | 1450 | Топ открытых моделей |
| MMLU | 89.2% | Общий интеллект |
| HumanEval | 86.0% | Кодинг |
| MATH | 79.7% | Логика и математика |
| GPQA | 69.9% | Научный анализ |
Meta продолжает политику доступности: через облачных провайдеров API стоит около $0.08 за 1M входных токенов и $0.30 за 1M выходных токенов.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
Опыт запуска Llama 4 Scout на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.08 / $0.30 за 1M токенов