Gemma 4 26B A4B IT is an instruction-tuned Mixture-of-Experts (MoE) model from Google DeepMind. Despite 25.2B total parameters, only 3.8B activate per token during inference — delivering near-31B quality at...
Gemma 4, представленная Google DeepMind весной 2026 года, совершила революцию в сегменте открытых моделей. Используя передовую архитектуру Mixture-of-Experts (MoE), модель 26B обеспечивает производительность, сопоставимую с гораздо более тяжелыми системами (31B+), при сохранении высочайшей скорости работы.
Главный секрет Gemma 4 — в её эффективности. При общем объеме параметров в 26 млрд, в каждый конкретный момент времени активируется лишь 3.8 млрд. Это позволяет модели работать молниеносно даже на потребительском оборудовании, не уступая в «интеллекте» тяжеловесным конкурентам.
Gemma 4 — это нативно мультимодальная модель. Она не просто «описывает» изображения или аудио, а глубоко понимает пространственные связи на видео и нюансы звуковых дорожек, что делает её идеальным «мозгом» для мобильных ассистентов.
Широкое окно контекста в 262 000 токенов позволяет загружать в Gemma 4 целые технические руководства или длинные переписки, обеспечивая точные ответы с учетом всех деталей.
| Бенчмарк | Результат Gemma 4 26B | Сравнение |
|---|---|---|
| Arena Elo | 1484 | Лидер среди открытых моделей среднего размера |
| MMLU | 89.7% | Уровень флагманов 2025 года |
| HumanEval | 91.2% | Высокое качество кода |
| MATH | 86.9% | Сильные аналитические способности |
| GPQA | 70.0% | Экспертные научные знания |
Google предлагает Gemma 4 через API по крайне агрессивным ценам: $0.06 за 1M входных токенов и $0.33 за 1M выходных токенов. Это делает её одной из самых выгодных моделей для массовой автоматизации.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
$0.06 / $0.33 за 1M токенов