К списку моделей

GigaChat 3.1 Ultra

4.4

От Sber

Open Source
CTX128K
Релиз: 2026-03-24
FlagshipRussianMoEOpen-SourceОткрытые весаРоссийские
Официальный сайт

Краткое описание

GigaChat 3.1 Ultra — флагманская instruct-модель семейства GigaChat от Сбера. Архитектура Mixture-of-Experts (MoE) с 702B параметрами, из которых 36B активируется на каждом шаге. Выпущена 24 марта 2026 года. Открытые веса под MIT-лицензией. Поддержка контекста 128K токенов, генерация и анализ изображений.

Подробный обзор модели

GigaChat 3.1 Ultra — это самая мощная языковая модель в истории Сбера, представленная в марте 2026 года. Она является результатом грандиозного инженерного проекта и одной из крупнейших моделей в мире, обученных в России. Используя передовую архитектуру Mixture-of-Experts (MoE) на 702 миллиарда параметров, GigaChat 3.1 Ultra предлагает флагманский уровень интеллекта, сравнимый с мировыми лидерами (GPT-5, Claude 4), при полной открытости весов для сообщества.

Архитектура и Open-Source лидерство

Сбер совершил беспрецедентный шаг, выложив веса модели GigaChat 3.1 Ultra в открытый доступ под лицензией MIT. Это сделало её самой большой и мощной Open-Source моделью, созданной для русского языка.

  • Масштабируемая MoE: Из 702 миллиардов параметров на каждом шаге генерации активируется всего 36 миллиардов. Это обеспечивает феноменальную точность рассуждений при сохранении высокой скорости работы, недоступной плотным (dense) моделям аналогичного уровня.
  • Мультимодальность: Модель нативно поддерживает не только генерацию текста, но и анализ изображений, а также создание графического контента, бесшовно интегрируя визуальные данные в общую логику ответов.
  • Контекстное окно 128K: Поддержка 128 000 токенов позволяет модели анализировать гигантские архивы документов, целые программные репозитории и длительные цепочки диалогов.

Производительность и бенчмарки

GigaChat 3.1 Ultra демонстрирует исключительные результаты, занимая топовые позиции как в мировых, так и в специализированных российских рейтингах.

БенчмаркРезультатОписание
Arena Hard RUТоп-1Лидер в понимании сложных запросов на русском языке
HumanEval90.9%Генерация программного кода флагманского уровня
MMLU84.2%Энциклопедические знания и общие рассуждения
MATH89.2%Математические способности премиум-класса
SuperGPQA48.9%Решение сложнейших научных задач

Ценообразование и доступность

Будучи Open-Source проектом, модель доступна для бесплатного скачивания и развертывания на собственных мощностях (требуются высокопроизводительные GPU-кластеры). Также Сбер предоставляет доступ к ней через GigaChat API, где стоимость использования регулируется стандартными тарифами платформы.

Идеальные сценарии применения (Use Cases)

  • Национальные и корпоративные ИИ-центры: Создание суверенных систем с полным контролем над данными.
  • Сложная программная инженерия: Проектирование архитектуры распределенных систем и глубокий аудит безопасности.
  • Глобальная аналитика: Обработка сверхбольших массивов неструктурированной мультимедийной информации.

Плюсы и минусы

Плюсы:

  • Полностью открытые веса (лицензия MIT).
  • Рекордная мощность и глубина рассуждений для русского языка.
  • Нативная мультимодальность высшего уровня.
  • Эффективная MoE-архитектура.

Минусы:

  • Экстремально высокие требования к оборудованию для локального запуска.
  • Большой размер модели затрудняет быструю итерацию в малых проектах.

На чем запустили?

Опыт запуска GigaChat 3.1 Ultra на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

По тарифам GigaChat API

Профиль модели

MMLU84.2%Code90.9%Math89.2%GPQA46%BBH70.3%AIME33.3%SGPQA48.9%MMLU RU82.7%

Бенчмарки

MMLU (Общие знания)84.2%
MMLU (Русский)82.7%
HumanEval (Кодинг)90.9%
MATH (Математика)89.2%
GPQA (Экспертные знания)46%
BBH (Рассуждения)70.3%
AIME (Олимпиадная математика)33.3%
SuperGPQA (Сложные вопросы)48.9%

Другие модели семейства GigaChat