От Sber
GigaChat 3.1 Ultra — флагманская instruct-модель семейства GigaChat от Сбера. Архитектура Mixture-of-Experts (MoE) с 702B параметрами, из которых 36B активируется на каждом шаге. Выпущена 24 марта 2026 года. Открытые веса под MIT-лицензией. Поддержка контекста 128K токенов, генерация и анализ изображений.
GigaChat 3.1 Ultra — это самая мощная языковая модель в истории Сбера, представленная в марте 2026 года. Она является результатом грандиозного инженерного проекта и одной из крупнейших моделей в мире, обученных в России. Используя передовую архитектуру Mixture-of-Experts (MoE) на 702 миллиарда параметров, GigaChat 3.1 Ultra предлагает флагманский уровень интеллекта, сравнимый с мировыми лидерами (GPT-5, Claude 4), при полной открытости весов для сообщества.
Сбер совершил беспрецедентный шаг, выложив веса модели GigaChat 3.1 Ultra в открытый доступ под лицензией MIT. Это сделало её самой большой и мощной Open-Source моделью, созданной для русского языка.
GigaChat 3.1 Ultra демонстрирует исключительные результаты, занимая топовые позиции как в мировых, так и в специализированных российских рейтингах.
| Бенчмарк | Результат | Описание |
|---|---|---|
| Arena Hard RU | Топ-1 | Лидер в понимании сложных запросов на русском языке |
| HumanEval | 90.9% | Генерация программного кода флагманского уровня |
| MMLU | 84.2% | Энциклопедические знания и общие рассуждения |
| MATH | 89.2% | Математические способности премиум-класса |
| SuperGPQA | 48.9% | Решение сложнейших научных задач |
Будучи Open-Source проектом, модель доступна для бесплатного скачивания и развертывания на собственных мощностях (требуются высокопроизводительные GPU-кластеры). Также Сбер предоставляет доступ к ней через GigaChat API, где стоимость использования регулируется стандартными тарифами платформы.
Плюсы:
Минусы:
Опыт запуска GigaChat 3.1 Ultra на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
По тарифам GigaChat API