К списку моделей

Gemini 2.5 Flash Lite

4.9

От Google

Proprietary
CTX1M
Релиз: 2025-07-22
FastGeneralText
Официальный сайт

Краткое описание

Gemini 2.5 Flash Lite — это самая доступная и быстрая модель в семействе Gemini 2.5. Она сочетает в себе контекстное окно в 1 млн токенов, высокую скорость генерации и минимальную стоимость, что делает её идеальной для агентских систем и обработки больших массивов данных.

Подробный обзор модели

Gemini 2.5 Flash Lite — это самая доступная и быстрая модель в семействе Gemini 2.5 от Google DeepMind, представленная 22 июля 2025 года. Она спроектирована специально для рабочих процессов с высокой частотой запросов и чувствительностью к задержкам. Модель занимает нишу между базовыми легковесными решениями и мощными флагманами, предлагая уникальное сочетание огромного контекстного окна и минимальной стоимости эксплуатации.

Архитектура и особенности

Flash Lite построена на оптимизированной архитектуре, которая позволяет достигать субсекундного времени отклика (в среднем около 0.44с). Главной технической особенностью является поддержка контекстного окна объемом 1 миллион токенов. Это позволяет модели анализировать огромные массивы данных — от целых библиотек документации до часовых видеороликов — без потери контекста.

Модель является мультимодальной на входе: она нативно понимает текст, изображения, аудио и видео. На выходе Flash Lite генерирует только текст, но делает это с невероятной скоростью. Еще одно важное нововведение — встроенный режим Reasoning (Thinking), который можно активировать для решения более сложных логических задач, требующих глубокого анализа.

Производительность и бенчмарки

Несмотря на статус облегченной модели, Gemini 2.5 Flash Lite демонстрирует впечатляющие результаты в синтетических тестах, обходя многие более тяжелые модели предыдущих поколений.

  • MMLU Pro: 80.9% — отличный показатель для моделей данного класса, подтверждающий глубокое понимание широкого спектра дисциплин.
  • MATH 500: 93.2% — высокая точность в решении математических задач.
  • GPQA Diamond: 68.3% — способность справляться с вопросами уровня аспирантуры в научных областях.
  • FACTS Grounding: 0.84/1 — высокая степень достоверности ответов и минимальный уровень галлюцинаций при работе с длинным контекстом.

Цены и доступность

Google позиционирует Flash Lite как наиболее выгодное решение для бизнеса и разработчиков. Ценовая политика агрессивна и направлена на вытеснение конкурентов в сегменте малых моделей:

  • Входящие токены: $0.10 за 1 миллион токенов.
  • Исходящие токены: $0.40 за 1 миллион токенов.

Такая стоимость делает модель в разы дешевле, чем Claude 3 Haiku или GPT-4o mini, при сохранении конкурентоспособной точности. Модель доступна через Google AI Studio и Vertex AI, а также поддерживает функции Function Calling, Structured Output и интеграцию с Google Search для проверки фактов.

Идеальные сценарии применения (Use Cases)

Благодаря своей скорости и дешевизне, Gemini 2.5 Flash Lite идеально подходит для следующих задач:

  • Анализ длинных документов: Суммаризация юридических контрактов, медицинских карт или технических спецификаций объемом до 1 млн токенов.
  • Мультимодальные чат-боты: Создание ассистентов, которые мгновенно отвечают на вопросы по загруженным изображениям или аудиозаписям.
  • Классификация и тегирование данных: Обработка миллионов строк данных в реальном времени с минимальными затратами.
  • Агентские воркфлоу: Использование модели в качестве «быстрого мыслителя» для управления автономными агентами и выполнения промежуточных проверок.
  • Real-time перевод: Высокоскоростной перевод текстов с сохранением сложной терминологии.

Плюсы и минусы

Плюсы:

  • Рекордное контекстное окно в 1 млн токенов для бюджетной модели.
  • Экстремально низкая стоимость токенов ($0.10 / $0.40).
  • Мультимодальность и нативная поддержка аудио/видео.
  • Высокая скорость генерации и низкая задержка.

Минусы:

  • Менее глубокая логика в сравнении с Pro-версиями при решении творческих задач.
  • Ограничение по максимальному выводу (65,535 токенов).
  • Знания ограничены отсечкой декабря 2024 года.

Стоимость API

$0.10 / $0.40 за 1M токенов

Профиль модели

MMLU84.1%Code92.4%Math71.5%GPQA63.9%SWE64.4%

Бенчмарки

Arena Elo (LMSYS)1389
MMLU (Общие знания)84.1%
HumanEval (Кодинг)92.4%
MATH (Математика)71.5%
GPQA (Экспертные знания)63.9%
SWE-bench (Разработка)64.4%

Другие модели семейства Gemini