От Sber
GigaChat 3 Lightning — компактная MoE-модель от Сбера (10B параметров, 1.8B активных). Выпущена под MIT-лицензией 24 марта 2026 года. Оптимизирована для локального запуска и высоконагруженных систем. Одна из лучших моделей в своём размере, конкурирует с Qwen-3-4B-Instruct.
GigaChat 3 Lightning — это высокоскоростная компактная языковая модель от Сбера, выпущенная в марте 2026 года под открытой лицензией MIT. Она представляет собой облегченную версию третьего поколения GigaChat, оптимизированную для мгновенного отклика и локального запуска на мобильных устройствах и обычных ПК. Благодаря использованию архитектуры Mixture-of-Experts (MoE), модель обеспечивает рекордную производительность в своём весовом классе.
GigaChat 3 Lightning построена на базе разреженной архитектуры с 10 миллиардами параметров, из которых при генерации каждого токена активно работают всего 1.8 миллиарда.
GigaChat 3 Lightning успешно конкурирует с мировыми лидерами компактного сегмента (например, Qwen-3-4B-Instruct) и является одной из лучших моделей для русского языка в своей категории.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MMLU | 72.0% | Базовые профессиональные знания |
| HumanEval | 74.0% | Качество генерации программного кода |
| MATH | 64.0% | Математические способности и логика |
| MERA (RU) | Высокий | Отличное понимание русского языка |
Модель полностью открыта и бесплатна для скачивания под лицензией MIT. Это позволяет любому разработчику интегрировать её в свои коммерческие продукты без лицензионных отчислений. Также она доступна через GigaChat API для высоконагруженных облачных решений.
Плюсы:
Минусы:
Опыт запуска GigaChat 3 Lightning на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
Бесплатно (Open-Source)