As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...
GLM 4.7 Flash — это высокоскоростная и экономичная языковая модель от компании Z.ai, представленная в январе 2026 года. С 30 миллиардами параметров, эта модель устанавливает новый стандарт для своего весового класса (SOTA в категории 30B), предлагая идеальный баланс между рекордной скоростью генерации и глубиной рассуждений. GLM 4.7 Flash специально оптимизирована для задач «агентного кодинга» и сложного планирования в реальном времени.
Модель была разработана как эффективное решение для высоконагруженных систем, требующих флагманского интеллекта при минимальных задержках.
GLM 4.7 Flash является лидером в сегменте 30B моделей, показывая результаты на уровне гораздо более тяжелых систем в задачах на логику и программирование.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MATH | 83.4% | Высокие математические способности для Flash-модели |
| Arena Elo | 1408 | Топ-уровень скоростных моделей 2026 года |
| MMLU | 85.7% | Глубокие общие знания и эрудиция |
| HumanEval | 83.3% | Хорошее качество генерации программного кода |
| GPQA | 66.8% | Научные тесты PhD-уровня |
| SWE_bench | 48.7% | Решение прикладных инженерных задач |
Модель доступна через API по крайне агрессивной цене: всего $0.06 за 1M входных токенов и $0.40 за 1M выходных токенов. Это делает GLM 4.7 Flash одним из самых выгодных решений на рынке для систем, требующих сочетания высокой точности и минимальной стоимости инференса.
Плюсы:
Минусы:
$0.06 / $0.40 за 1M токенов