GLM-4.5V is a vision-language foundation model for multimodal agent applications. Built on a Mixture-of-Experts (MoE) architecture with 106B parameters and 12B activated parameters, it achieves state-of-the-art results in video understanding,...
GLM 4.5V — это флагманская мультимодальная языковая модель от компании Z.ai, представленная в августе 2025 года. Она была специально спроектирована как фундамент для сложных ИИ-агентов, требующих глубокого визуального понимания и пошагового рассуждения. Используя архитектуру Mixture-of-Experts (MoE) с общим объемом в 106 миллиардов параметров, модель активирует лишь 12 миллиардов на каждом шаге, предлагая исключительный баланс между мощностью интеллекта и скоростью работы.
GLM 4.5V представляет собой вершину достижений серии GLM в области компьютерного зрения и обработки видео.
GLM 4.5V уверенно занимает топовые позиции в рейтингах мультимодальных систем, подтверждая свою эффективность в самых требовательных тестах.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MATH | 89.5% | Мастерство в математических рассуждениях (премиум) |
| Arena Elo | 1417 | Высокий флагманский уровень |
| MMLU | 86.4% | Глубокие общие знания и эрудиция |
| HumanEval | 80.2% | Уверенное владение программированием |
| GPQA | 68.8% | Научные вопросы PhD-уровня |
| SWE_bench | 46.6% | Решение прикладных инженерных задач |
Модель доступна через API Z.ai и популярных агрегаторов по цене $0.60 за 1M входных токенов и $1.80 за 1M выходных токенов. Это крайне сбалансированное предложение для профессионального использования, ориентированное на создание продвинутых визуальных помощников и систем автоматизации.
Плюсы:
Минусы:
$0.60 / $1.80 за 1M токенов