К списку моделей

Gemma 3n 2B (free)

4.6

От Google

Proprietary
CTX8K
Релиз: 2025-07-09
StandardGeneralText
Официальный сайт

Краткое описание

Gemma 3n E2B IT is a multimodal, instruction-tuned model developed by Google DeepMind, designed to operate efficiently at an effective parameter size of 2B while leveraging a 6B architecture. Based...

Подробный обзор модели

Обзор Google Gemma 3n 2B (Free): Компактный интеллект нового поколения (2026)

Gemma 3n 2B (Free) — это сверхкомпактная мультимодальная модель от Google DeepMind, представленная в июле 2025 года. Несмотря на скромный «эффективный» размер в 2 миллиарда параметров, она использует архитектурные наработки 6-миллиардных моделей, что позволяет ей демонстрировать выдающуюся производительность в своем классе.

Особенности архитектуры Gemma 3n 2B

1. Эффективный инференс (2B на базе 6B)

Модель использует технологию дистилляции и разреженных весов, что дает ей интеллект уровня 6B моделей при скорости работы и потреблении памяти, характерных для 2B. Это делает её идеальным выбором для встраиваемых систем и ультра-бюджетных облачных решений.

2. Мультимодальность «из коробки»

Gemma 3n 2B поддерживает одновременную обработку текста и визуальных данных. Она способна описывать изображения, читать текст с фото и отвечать на вопросы по визуальному контенту, что является редкостью для моделей такого малого размера.

3. Инструктивная настройка (IT)

Модель прошла тщательную процедуру дообучения на инструкциях, что минимизирует галлюцинации и обеспечивает точное следование сложным запросам пользователя.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат Gemma 3n 2B (Free)Категория
Arena Elo1418Топ в сегменте Ultra-Light
MMLU86.5%Базовые знания
HumanEval92.2%Написание кода (феноменально)
MATH92.7%Математика и логика
GPQA67.2%Научные тесты
SWE_bench55.4%Инженерные задачи

Преимущества бесплатного доступа

  • Нулевая стоимость: Доступна через API (например, OpenRouter) совершенно бесплатно, что позволяет масштабировать простые задачи без бюджета.
  • Оптимальный контекст: Окно в 8K токенов достаточно для большинства повседневных диалогов и анализа небольших фрагментов кода или статей.

Сценарии использования

  • Микро-сервисы: Быстрая классификация текста, извлечение сущностей и суммаризация «на лету».
  • IoT и Edge-устройства: Использование в умных колонках и камерах для базового понимания контекста без облака.
  • Учебные проекты: Отличный полигон для изучения возможностей мультимодальных моделей.

Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

Стоимость API

$0.00 / $0.00 за 1M токенов

Профиль модели

MMLU86.5%Code92.2%Math92.7%GPQA67.2%SWE55.4%

Бенчмарки

Arena Elo (LMSYS)1418
MMLU (Общие знания)86.5%
HumanEval (Кодинг)92.2%
MATH (Математика)92.7%
GPQA (Экспертные знания)67.2%
SWE-bench (Разработка)55.4%

Другие модели семейства Other