К списку моделей

Gemma 3 12B

4.7

От Google

Proprietary
CTX131K
Релиз: 2025-03-13
StandardGeneralMultimodal
Официальный сайт

Краткое описание

Gemma 3 introduces multimodality, supporting vision-language input and text outputs. It handles context windows up to 128k tokens, understands over 140 languages, and offers improved math, reasoning, and chat capabilities,...

Подробный обзор модели

Обзор Google Gemma 3 12B: Золотой стандарт открытого ИИ (2026)

Gemma 3 12B — это сбалансированная и высокопроизводительная модель от Google DeepMind, выпущенная в марте 2025 года. Она представляет собой «золотую середину» в семействе Gemma 3, сочетая в себе мощный интеллект, нативную мультимодальность и отличную скорость работы при разумной стоимости.

Ключевые преимущества Gemma 3 12B

1. Нативная мультимодальность

Как и все модели третьего поколения Gemma, версия 12B изначально обучена работе с визуальными данными. Она отлично справляется с анализом сложных изображений, диаграмм и схем, обеспечивая глубокое понимание контекста и точные ответы на вопросы по визуальному контенту.

2. Поддержка 140+ языков

Google уделила огромное внимание глобальному охвату. Gemma 3 12B демонстрирует выдающиеся результаты в понимании нюансов и культурных контекстов более чем 140 языков, включая русский, на уровне, сопоставимом с гораздо более крупными моделями.

3. Работа с длинным контекстом 128K

Поддержка контекстного окна до 128 000 токенов делает эту модель идеальной для профессионального использования. Она может анализировать объемные технические задания, длинные цепочки диалогов и массивные кодовые базы без потери качества.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат Gemma 3 12BКатегория
Arena Elo1418Сильный средний вес
MMLU86.5%Знания и эрудиция
HumanEval86.2%Генерация кода
MATH93.1%Математические рассуждения
GPQA69.0%Сложные научные тесты
SWE_bench50.1%Задачи разработки

Сценарии использования

  • Корпоративные ассистенты: Создание надежных помощников для анализа внутренних документов и поддержки клиентов.
  • Помощь разработчикам: Написание, аудит и документирование кода с учетом широкого контекста проекта.
  • Анализ мультимедиа: Использование возможностей зрения для классификации и описания визуального контента.

Доступность

Модель доступна через API по крайне привлекательной цене ($0.04 за 1M входных токенов), а также в виде открытых весов для локального развертывания на мощном пользовательском оборувени.


Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

Стоимость API

$0.04 / $0.13 за 1M токенов

Профиль модели

MMLU86.5%Code86.2%Math93.1%GPQA69%SWE50.1%

Бенчмарки

Arena Elo (LMSYS)1418
MMLU (Общие знания)86.5%
HumanEval (Кодинг)86.2%
MATH (Математика)93.1%
GPQA (Экспертные знания)69%
SWE-bench (Разработка)50.1%

Другие модели семейства Other