Gemini 2.5 Flash Lite — это самая доступная и быстрая модель в семействе Gemini 2.5. Она сочетает в себе контекстное окно в 1 млн токенов, высокую скорость генерации и минимальную стоимость, что делает её идеальной для агентских систем и обработки больших массивов данных.
Gemini 2.5 Flash Lite — это самая доступная и быстрая модель в семействе Gemini 2.5 от Google DeepMind, представленная 22 июля 2025 года. Она спроектирована специально для рабочих процессов с высокой частотой запросов и чувствительностью к задержкам. Модель занимает нишу между базовыми легковесными решениями и мощными флагманами, предлагая уникальное сочетание огромного контекстного окна и минимальной стоимости эксплуатации.
Flash Lite построена на оптимизированной архитектуре, которая позволяет достигать субсекундного времени отклика (в среднем около 0.44с). Главной технической особенностью является поддержка контекстного окна объемом 1 миллион токенов. Это позволяет модели анализировать огромные массивы данных — от целых библиотек документации до часовых видеороликов — без потери контекста.
Модель является мультимодальной на входе: она нативно понимает текст, изображения, аудио и видео. На выходе Flash Lite генерирует только текст, но делает это с невероятной скоростью. Еще одно важное нововведение — встроенный режим Reasoning (Thinking), который можно активировать для решения более сложных логических задач, требующих глубокого анализа.
Несмотря на статус облегченной модели, Gemini 2.5 Flash Lite демонстрирует впечатляющие результаты в синтетических тестах, обходя многие более тяжелые модели предыдущих поколений.
Google позиционирует Flash Lite как наиболее выгодное решение для бизнеса и разработчиков. Ценовая политика агрессивна и направлена на вытеснение конкурентов в сегменте малых моделей:
Такая стоимость делает модель в разы дешевле, чем Claude 3 Haiku или GPT-4o mini, при сохранении конкурентоспособной точности. Модель доступна через Google AI Studio и Vertex AI, а также поддерживает функции Function Calling, Structured Output и интеграцию с Google Search для проверки фактов.
Благодаря своей скорости и дешевизне, Gemini 2.5 Flash Lite идеально подходит для следующих задач:
Плюсы:
Минусы:
$0.10 / $0.40 за 1M токенов