К списку моделей

Gemma 3 4B

4.1

От Google

Proprietary
CTX131K
Релиз: 2025-03-13
StandardGeneralMultimodal
Официальный сайт

Краткое описание

Gemma 3 introduces multimodality, supporting vision-language input and text outputs. It handles context windows up to 128k tokens, understands over 140 languages, and offers improved math, reasoning, and chat capabilities,...

Подробный обзор модели

Обзор Google Gemma 3 4B: Малый гигант мультимодальности (2026)

Gemma 3 4B — это компактная, но невероятно мощная модель от Google DeepMind, представленная в марте 2025 года. Она является частью третьего поколения семейства Gemma и устанавливает новые стандарты производительности для моделей малого размера, предлагая нативную мультимодальность и внушительный контекст.

Технологический прорыв Gemma 3 4B

1. Феноменальная эффективность

Несмотря на наличие всего 4 миллиардов параметров, Gemma 3 4B демонстрирует результаты, которые зачастую превосходят показатели гораздо более крупных моделей предыдущих поколений. Это делает её идеальным выбором для задач, требующих высокой скорости и точности при минимальных затратах.

2. Мультимодальный интеллект

Модель поддерживает работу с текстом и изображениями «из коробки». Она способна анализировать сложные визуальные сцены, читать мелкий текст на картинках и отвечать на уточняющие вопросы по изображениям, сохраняя при этом высокую скорость ответа.

3. Работа с длинным контекстом 128K

Поддержка контекстного окна до 128 000 токенов — это огромный плюс для 4B-модели. Это позволяет использовать её для анализа длинных цепочек диалогов, поиска информации в объемных инструкциях и даже для помощи в написании кода для целых модулей.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат Gemma 3 4BКатегория
Arena Elo1432Лидер в легком весе
MMLU87.7%Общие знания
HumanEval93.0%Кодинг (премиум уровень)
MATH93.3%Математические вычисления
GPQA63.0%Сложные научные тесты
SWE_bench65.4%Разработка ПО

Сценарии использования

  • Интерактивные помощники: Быстрые и умные чат-боты с поддержкой зрения для сайтов и приложений.
  • Анализ интерфейсов: Использование в автоматизированном тестировании UI и описании визуального контента.
  • Edge Computing: Запуск на локальных серверах и мощных пользовательских устройствах для обеспечения конфиденциальности.

Доступность и экономика

Gemma 3 4B — одна из самых дешевых моделей на рынке ($0.04 за 1M входных токенов). Её экономическая эффективность в сочетании с высоким интеллектом делает её фаворитом для массовых ИИ-интеграций.


Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

Стоимость API

$0.04 / $0.08 за 1M токенов

Профиль модели

MMLU87.7%Code93%Math93.3%GPQA63%SWE65.4%

Бенчмарки

Arena Elo (LMSYS)1432
MMLU (Общие знания)87.7%
HumanEval (Кодинг)93%
MATH (Математика)93.3%
GPQA (Экспертные знания)63%
SWE-bench (Разработка)65.4%

Другие модели семейства Other