К списку моделей

GPT-5 Image Mini

5.0

От OpenAI

Proprietary
CTX400K
Релиз: 2025-10-16
FastGeneralText
Официальный сайт

Краткое описание

GPT-5 Image Mini combines OpenAI's advanced language capabilities, powered by [GPT-5 Mini](https://openrouter.ai/openai/gpt-5-mini), with GPT Image 1 Mini for efficient image generation. This natively multimodal model features superior instruction following, text...

Подробный обзор модели

GPT-5 Image Mini — это высокоскоростная и экономичная мультимодальная модель от OpenAI, представленная в октябре 2025 года. Она объединяет в себе флагманский текстовый интеллект серии GPT-5 Mini с передовыми возможностями генерации и анализа изображений GPT Image 1 Mini. Эта модель создана для массового использования в приложениях, требующих мгновенной обработки визуально-текстовой информации и создания графического контента с минимальными задержками.

Особенности и мультимодальная мощь

GPT-5 Image Mini является самым легким представителем визуальной линейки GPT-5, предлагая рекордную эффективность инференса.

  • Бесшовная интеграция: Модель нативно поддерживает обработку текста и изображений в рамках единого пайплайна. Она не только генерирует картинки по описанию, но и глубоко понимает визуальный контекст предоставленных фотографий, скриншотов и схем.
  • Исключительное следование инструкциям: Благодаря ядру GPT-5, модель демонстрирует высочайшую точность в выполнении сложных текстовых условий при генерации визуального контента, корректно интерпретируя пространственные и стилистические требования.
  • Огромный контекст 400K: Поддержка контекстного окна в 400 000 токенов позволяет модели удерживать в памяти детальные описания визуальных проектов, сохраняя согласованность персонажей и стилей на протяжении длительной работы.

Производительность и бенчмарки

Модель устанавливает новые стандарты для компактных мультимодальных систем, показывая выдающиеся результаты в тестах на логику и визуальный анализ.

БенчмаркРезультатОписание
Arena Elo1407Лидер среди компактных мультимодальных моделей
HumanEval84.6%Высокое качество генерации программного кода
MMLU85.6%Глубокие общие знания и эрудиция
GPQA61.1%Научные вопросы PhD-уровня
MATH72.9%Хорошие способности в математике и логике
SWE_bench48.9%Решение инженерных задач в реальных условиях

Ценообразование и доступность

GPT-5 Image Mini доступна через API OpenAI и популярных агрегаторов по цене $2.50 за 1M входных токенов и $2.00 за 1M выходных токенов. Это крайне выгодное предложение для профессионалов и разработчиков, которым требуется сочетание высокой скорости, широкого контекста и флагманского мультимодального интеллекта.

Идеальные сценарии применения (Use Cases)

  • Масштабируемый анализ мультимедиа: Быстрое описание, классификация и поиск информации в огромных архивах изображений.
  • Интерактивные Vision-ассистенты: Создание отзывчивых помощников для мобильных приложений, способных «видеть» через камеру и вести диалог.
  • Быстрое прототипирование контента: Мгновенная генерация иллюстраций, иконок и UI-элементов на основе текстовых запросов.

Плюсы и минусы

Плюсы:

  • Рекордная скорость генерации ответов и изображений.
  • Огромное контекстное окно (400K).
  • Исключительная точность следования визуальным инструкциям.
  • Нативная мультимодальность высшего уровня.

Минусы:

  • В сверхсложных философских рассуждениях может уступать полноразмерным флагманам.
  • Ограниченное разрешение генерации по сравнению со старшими моделями серии Image.

Стоимость API

$2.50 / $2.00 за 1M токенов

Профиль модели

MMLU85.6%Code84.6%Math72.9%GPQA61.1%SWE48.9%

Бенчмарки

Arena Elo (LMSYS)1407
MMLU (Общие знания)85.6%
HumanEval (Кодинг)84.6%
MATH (Математика)72.9%
GPQA (Экспертные знания)61.1%
SWE-bench (Разработка)48.9%

Другие модели семейства GPT