К списку моделей

Llama 4 Scout

4.6

От Meta

Open Source
CTX328K
Релиз: 2025-04-05
StandardGeneralMultimodalОткрытые весаЛокальная
Официальный сайт

Краткое описание

Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input...

Подробный обзор модели

Обзор Llama 4 Scout: Новая эра открытого ИИ от Meta (2026)

Llama 4 Scout, выпущенная Meta в апреле 2025 года, стала первой моделью в долгожданном четвертом поколении семейства Llama. Это экспериментальная и мощная MoE-модель (Mixture-of-Experts), которая служит «разведчиком» для будущих полноразмерных флагманов, предлагая нативную мультимодальность и рекордную для открытых моделей эффективность.

Что нового в Llama 4 Scout?

1. Архитектура MoE (109B всего / 17B активных)

Meta впервые применила архитектуру Mixture-of-Experts в основной линейке Llama. Со 109 миллиардами параметров, из которых только 17 миллиардов активны при каждом запросе, модель Scout обеспечивает производительность уровня Llama 3 70B при скорости и стоимости работы маленьких моделей.

2. Нативная мультимодальность

В отличие от предыдущих версий, где зрение добавлялось через адаптеры, Llama 4 Scout была обучена как мультимодальная система с первого дня. Это обеспечивает бесшовную интеграцию текстовых и визуальных данных, позволяя модели «видеть» и «рассуждать» о мире в реальном времени.

3. Гигантский контекст 328K

С окном контекста в 328 000 токенов, Scout может обрабатывать целые книги, обширные кодовые базы и длинные транскрипции видео без потери фокуса на деталях.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат Llama 4 ScoutКатегория
Arena Elo1450Топ открытых моделей
MMLU89.2%Общий интеллект
HumanEval86.0%Кодинг
MATH79.7%Логика и математика
GPQA69.9%Научный анализ

Сценарии использования

  • Персональные ИИ-ассистенты: Благодаря мультимодальности и эффективности, модель идеальна для локального запуска на современных ПК.
  • Анализ мультимедиа: Поиск и классификация информации в больших архивах изображений и видео.
  • Разработка ПО: Помощь в написании кода и анализе структуры больших проектов благодаря широкому контексту.

Ценообразование

Meta продолжает политику доступности: через облачных провайдеров API стоит около $0.08 за 1M входных токенов и $0.30 за 1M выходных токенов.


Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

На чем запустили?

Опыт запуска Llama 4 Scout на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.08 / $0.30 за 1M токенов

Профиль модели

MMLU89.2%Code86%Math79.7%GPQA69.9%SWE51.4%

Бенчмарки

Arena Elo (LMSYS)1450
MMLU (Общие знания)89.2%
HumanEval (Кодинг)86%
MATH (Математика)79.7%
GPQA (Экспертные знания)69.9%
SWE-bench (Разработка)51.4%

Другие модели семейства Llama