К списку моделей

YandexGPT 5 Lite

3.8

От Yandex

Open Source
CTX32K
Релиз: 2025-03-31
LiteRussianOpen-SourceОткрытые весаРоссийские
Официальный сайт

Краткое описание

YandexGPT 5 Lite — компактная LLM на 8 млрд параметров от Яндекса. Выложена в открытый доступ (pretrain и instruct версии на Hugging Face). Поддержка контекста 32K токенов. Превосходит зарубежные аналоги того же размера в большинстве русскоязычных бенчмарков.

Подробный обзор модели

YandexGPT 5 Lite — это первая в истории Яндекса языковая модель на 8 миллиардов параметров, выпущенная в открытый доступ (Open-Source). Представленная в марте 2025 года, она была создана для того, чтобы предоставить разработчикам эффективный инструмент для локального запуска и дообучения на собственных данных, сохраняя при этом лидирующее качество работы с русским языком.

Архитектура и Open-Source

YandexGPT 5 Lite знаменует собой важный этап открытости российских ИИ-технологий. Яндекс опубликовал на платформе Hugging Face две версии модели: базовую (pretrain) и настроенную на диалог (instruct).

  • Эффективный размер: С 8 миллиардами параметров модель может работать на потребительских видеокартах или даже на современных ноутбуках, обеспечивая высокую скорость генерации при минимальном потреблении памяти.
  • Поддержка русского языка: В отличие от зарубежных Llama или Qwen аналогичного размера, YandexGPT 5 Lite обучалась на огромном массиве качественных русскоязычных текстов, что дает ей преимущество в понимании сленга, культурных особенностей и грамматики.
  • Контекстное окно: Модель поддерживает 32 000 токенов, чего вполне достаточно для создания чат-ботов, суммаризации статей и выполнения большинства офисных задач.

Производительность и бенчмарки

Несмотря на статус «Lite», модель показывает впечатляющие результаты, обходя многие зарубежные аналоги того же весового класса в русскоязычных тестах.

БенчмаркРезультатОписание
MMLU71.6%Общие академические знания
GSM8K81.3%Математические задачи среднего уровня
HumanEval71.3%Написание кода и логика
MBPP66.7%Решение типовых задач по Python

Ценообразование и доступность

Модель доступна совершенно бесплатно для скачивания и локального запуска под лицензией Яндекса. Для тех, кто предпочитает облачное использование, она доступна через API Yandex Cloud по крайне низкой цене — около $0.83 за 1M входных токенов, что делает её одной из самых экономичных моделей на рынке.

Идеальные сценарии применения (Use Cases)

  • Локальные ИИ-инструменты: Использование в приложениях, где критична конфиденциальность данных и работа без доступа к сети.
  • Микро-сервисы обработки текста: Быстрая классификация сообщений, извлечение сущностей и автоматизация простых ответов в CRM.
  • Дообучение (Fine-tuning): Использование в качестве фундамента для создания узкоспециализированных моделей (например, юридических или медицинских ассистентов).

Плюсы и минусы

Плюсы:

  • Открытый доступ к весам модели.
  • Лучшее в своем классе (8B) понимание русского языка.
  • Низкие требования к «железу».
  • Очень низкая стоимость использования через API.

Минусы:

  • Ограниченная глубина рассуждений по сравнению с Pro-версиями.
  • Контекстное окно (32K) может быть недостаточно для работы с очень длинными документами.

На чем запустили?

Опыт запуска YandexGPT 5 Lite на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

~$0.83 / $0.83 за 1M токенов

Профиль модели

MMLU71.6%Code71.3%Math54.6%GSM8K81.3%MBPP66.7%

Бенчмарки

MMLU (Общие знания)71.6%
HumanEval (Кодинг)71.3%
MATH (Математика)54.6%
GSM8K (Школьная математика)81.3%
MBPP (Python-задачи)66.7%

Другие модели семейства YandexGPT