Gemma 3 introduces multimodality, supporting vision-language input and text outputs. It handles context windows up to 128k tokens, understands over 140 languages, and offers improved math, reasoning, and chat capabilities,...
Gemma 3 4B — это компактная, но невероятно мощная модель от Google DeepMind, представленная в марте 2025 года. Она является частью третьего поколения семейства Gemma и устанавливает новые стандарты производительности для моделей малого размера, предлагая нативную мультимодальность и внушительный контекст.
Несмотря на наличие всего 4 миллиардов параметров, Gemma 3 4B демонстрирует результаты, которые зачастую превосходят показатели гораздо более крупных моделей предыдущих поколений. Это делает её идеальным выбором для задач, требующих высокой скорости и точности при минимальных затратах.
Модель поддерживает работу с текстом и изображениями «из коробки». Она способна анализировать сложные визуальные сцены, читать мелкий текст на картинках и отвечать на уточняющие вопросы по изображениям, сохраняя при этом высокую скорость ответа.
Поддержка контекстного окна до 128 000 токенов — это огромный плюс для 4B-модели. Это позволяет использовать её для анализа длинных цепочек диалогов, поиска информации в объемных инструкциях и даже для помощи в написании кода для целых модулей.
| Бенчмарк | Результат Gemma 3 4B | Категория |
|---|---|---|
| Arena Elo | 1432 | Лидер в легком весе |
| MMLU | 87.7% | Общие знания |
| HumanEval | 93.0% | Кодинг (премиум уровень) |
| MATH | 93.3% | Математические вычисления |
| GPQA | 63.0% | Сложные научные тесты |
| SWE_bench | 65.4% | Разработка ПО |
Gemma 3 4B — одна из самых дешевых моделей на рынке ($0.04 за 1M входных токенов). Её экономическая эффективность в сочетании с высоким интеллектом делает её фаворитом для массовых ИИ-интеграций.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
$0.04 / $0.08 за 1M токенов