К списку моделей

GigaChat 3 Lightning

3.9

От Sber

Open Source
CTX128K
Релиз: 2026-03-24
CompactRussianMoEOpen-SourceОткрытые весаРоссийские
Официальный сайт

Краткое описание

GigaChat 3 Lightning — компактная MoE-модель от Сбера (10B параметров, 1.8B активных). Выпущена под MIT-лицензией 24 марта 2026 года. Оптимизирована для локального запуска и высоконагруженных систем. Одна из лучших моделей в своём размере, конкурирует с Qwen-3-4B-Instruct.

Подробный обзор модели

GigaChat 3 Lightning — это высокоскоростная компактная языковая модель от Сбера, выпущенная в марте 2026 года под открытой лицензией MIT. Она представляет собой облегченную версию третьего поколения GigaChat, оптимизированную для мгновенного отклика и локального запуска на мобильных устройствах и обычных ПК. Благодаря использованию архитектуры Mixture-of-Experts (MoE), модель обеспечивает рекордную производительность в своём весовом классе.

Архитектура и эффективность

GigaChat 3 Lightning построена на базе разреженной архитектуры с 10 миллиардами параметров, из которых при генерации каждого токена активно работают всего 1.8 миллиарда.

  • Молниеносная реакция: Название «Lightning» отражает главную фишку модели — ультра-низкую задержку. Она идеально подходит для интерактивных систем, где ответ должен появляться мгновенно.
  • Умное потребление ресурсов: Архитектура 10B-A1.8B позволяет модели демонстрировать интеллект уровня 7B-10B плотных (dense) моделей, потребляя при этом в разы меньше памяти и вычислительной мощности.
  • Контекстное окно 128K: Поддержка широкого контекста для такой компактной модели — серьезное преимущество, позволяющее работать с длинными переписками и документами без потери качества.

Производительность и бенчмарки

GigaChat 3 Lightning успешно конкурирует с мировыми лидерами компактного сегмента (например, Qwen-3-4B-Instruct) и является одной из лучших моделей для русского языка в своей категории.

БенчмаркРезультатОписание
MMLU72.0%Базовые профессиональные знания
HumanEval74.0%Качество генерации программного кода
MATH64.0%Математические способности и логика
MERA (RU)ВысокийОтличное понимание русского языка

Ценообразование и доступность

Модель полностью открыта и бесплатна для скачивания под лицензией MIT. Это позволяет любому разработчику интегрировать её в свои коммерческие продукты без лицензионных отчислений. Также она доступна через GigaChat API для высоконагруженных облачных решений.

Идеальные сценарии применения (Use Cases)

  • Интерактивные персональные ассистенты: Создание «умных» помощников на смартфонах и Edge-устройствах.
  • Высоконагруженные чат-боты: Использование в системах с миллионами запросов, где критична стоимость и скорость инференса.
  • Микро-сервисы классификации и парсинга: Быстрая автоматизация рутинных текстовых задач в реальном времени.

Плюсы и минусы

Плюсы:

  • Открытая лицензия MIT (полная свобода использования).
  • Рекордная скорость генерации при малом потреблении памяти.
  • Огромный контекст (128K) для компактной модели.
  • Нативная оптимизация под русский язык.

Минусы:

  • Уступает старшим моделям (Ultra, Max) в сложных логических задачах.
  • Ограниченная мультимодальность по сравнению с флагманами.

На чем запустили?

Опыт запуска GigaChat 3 Lightning на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

Бесплатно (Open-Source)

Профиль модели

MMLU72%Code74%Math64%

Бенчмарки

MMLU (Общие знания)72%
HumanEval (Кодинг)74%
MATH (Математика)64%

Другие модели семейства GigaChat