К списку моделей

GLM 4.7 Flash

4.5

От Z.ai

Proprietary
CTX203K
Релиз: 2026-01-19
FastGeneralText
Официальный сайт

Краткое описание

As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...

Подробный обзор модели

GLM 4.7 Flash — это высокоскоростная и экономичная языковая модель от компании Z.ai, представленная в январе 2026 года. С 30 миллиардами параметров, эта модель устанавливает новый стандарт для своего весового класса (SOTA в категории 30B), предлагая идеальный баланс между рекордной скоростью генерации и глубиной рассуждений. GLM 4.7 Flash специально оптимизирована для задач «агентного кодинга» и сложного планирования в реальном времени.

Особенности и программный интеллект

Модель была разработана как эффективное решение для высоконагруженных систем, требующих флагманского интеллекта при минимальных задержках.

  • Мастерство кодинга и планирования: В отличие от обычных Flash-моделей, версия 4.7 была усилена в области программной инженерии. Она демонстрирует высокую стабильность при решении многоэтапных задач, умеет точно планировать ворклоу и исправлять сложные логические баги в коде.
  • Ультра-быстрый инференс: Благодаря облегченной, но плотной архитектуре, модель обеспечивает практически мгновенный отклик, что критично для интерактивных систем автозаполнения и виртуальных ассистентов.
  • Широкий контекст 203K: Поддержка контекстного окна до 203 000+ токенов позволяет GLM 4.7 Flash эффективно работать с объемными базами данных и технической документацией без потери связности рассуждений.

Производительность и бенчмарки

GLM 4.7 Flash является лидером в сегменте 30B моделей, показывая результаты на уровне гораздо более тяжелых систем в задачах на логику и программирование.

БенчмаркРезультатОписание
MATH83.4%Высокие математические способности для Flash-модели
Arena Elo1408Топ-уровень скоростных моделей 2026 года
MMLU85.7%Глубокие общие знания и эрудиция
HumanEval83.3%Хорошее качество генерации программного кода
GPQA66.8%Научные тесты PhD-уровня
SWE_bench48.7%Решение прикладных инженерных задач

Ценообразование и доступность

Модель доступна через API по крайне агрессивной цене: всего $0.06 за 1M входных токенов и $0.40 за 1M выходных токенов. Это делает GLM 4.7 Flash одним из самых выгодных решений на рынке для систем, требующих сочетания высокой точности и минимальной стоимости инференса.

Идеальные сценарии применения (Use Cases)

  • Масштабируемые кодинг-агенты: Создание систем, способных быстро и точно обрабатывать тикеты и генерировать тесты.
  • Интеллектуальный поиск и суммаризация: Быстрая обработка огромных массивов текстовой информации с извлечением ключевых смыслов.
  • Корпоративные чат-боты: Реализация отзывчивых помощников для сотрудников с глубоким знанием внутренних процессов компании.

Плюсы и минусы

Плюсы:

  • Лучшая в своем классе (30B) производительность.
  • Ультра-низкая задержка и выгодная стоимость API.
  • Широкое контекстное окно (203K).
  • Специализация на инженерных и агентных задачах.

Минусы:

  • В сверхсложных философских рассуждениях может уступать старшей версии 4.7.
  • Проприетарная модель (доступ только через API).

Стоимость API

$0.06 / $0.40 за 1M токенов

Профиль модели

MMLU85.7%Code83.3%Math83.4%GPQA66.8%SWE48.7%

Бенчмарки

Arena Elo (LMSYS)1408
MMLU (Общие знания)85.7%
HumanEval (Кодинг)83.3%
MATH (Математика)83.4%
GPQA (Экспертные знания)66.8%
SWE-bench (Разработка)48.7%

Другие модели семейства Other