Name: GPT-5 Image Mini
Author: OpenAI

Краткое описание

GPT-5 Image Mini сочетает в себе расширенные языковые возможности OpenAI, основанные на [GPT-5 Mini](https://openrouter.ai/openai/gpt-5-mini), с GPT Image 1 Mini для эффективного создания изображений. Эта изначально мультимодальная модель отличается превосходным следованием инструкциям, текстовым...

Агрегированный профиль

GPT-5 Image Mini сильнее всего выглядит в категории «код». Индекс 32/100 рассчитан по процентильным позициям в 2 сопоставимых тестах; уверенность — средняя. Это навигационная оценка, а не замена тесту на ваших задачах.

Код32/100

2 сопоставимых теста · уверенность: средняя

Рассуждения22/100

3 сопоставимых теста · уверенность: средняя

Как рассчитан профиль →

Место модели в каталоге

Позиция рассчитана только среди моделей, для которых в каталоге указан результат того же теста. Это помогает сравнивать карточки, но не заменяет проверку модели на вашей задаче.

Бенчмарк	Результат	Место	Доказательство
Arena Elo (LMSYS)	1407	223 из 384	Источник не указан
MMLU (Общие знания)	85.6%	221 из 391	Источник не указан
HumanEval (Кодинг)	84.6%	242 из 391	Источник не указан
MATH (Математика)	72.9%	359 из 391	Источник не указан
GPQA (Экспертные знания)	61.1%	335 из 390	Источник не указан
SWE-bench (Разработка)	48.9%	280 из 381	Источник не указан

Подробный обзор модели

GPT-5 Image Mini — это высокоскоростная и экономичная мультимодальная модель от OpenAI, представленная в октябре 2025 года. Она объединяет в себе флагманский текстовый интеллект серии GPT-5 Mini с передовыми возможностями генерации и анализа изображений GPT Image 1 Mini. Эта модель создана для массового использования в приложениях, требующих мгновенной обработки визуально-текстовой информации и создания графического контента с минимальными задержками.

Особенности и мультимодальная мощь

GPT-5 Image Mini является самым легким представителем визуальной линейки GPT-5, предлагая рекордную эффективность инференса.

Бесшовная интеграция: Модель нативно поддерживает обработку текста и изображений в рамках единого пайплайна. Она не только генерирует картинки по описанию, но и глубоко понимает визуальный контекст предоставленных фотографий, скриншотов и схем.
Исключительное следование инструкциям: Благодаря ядру GPT-5, модель демонстрирует высочайшую точность в выполнении сложных текстовых условий при генерации визуального контента, корректно интерпретируя пространственные и стилистические требования.
Огромный контекст 400K: Поддержка контекстного окна в 400 000 токенов позволяет модели удерживать в памяти детальные описания визуальных проектов, сохраняя согласованность персонажей и стилей на протяжении длительной работы.

Производительность и бенчмарки

Модель устанавливает новые стандарты для компактных мультимодальных систем, показывая выдающиеся результаты в тестах на логику и визуальный анализ.

Бенчмарк	Результат	Описание
Arena Elo	1407	Лидер среди компактных мультимодальных моделей
HumanEval	84.6%	Высокое качество генерации программного кода
MMLU	85.6%	Глубокие общие знания и эрудиция
GPQA	61.1%	Научные вопросы PhD-уровня
MATH	72.9%	Хорошие способности в математике и логике
SWE_bench	48.9%	Решение инженерных задач в реальных условиях

Ценообразование и доступность

GPT-5 Image Mini доступна через API OpenAI и популярных агрегаторов по цене $2.50 за 1M входных токенов и $2.00 за 1M выходных токенов. Это крайне выгодное предложение для профессионалов и разработчиков, которым требуется сочетание высокой скорости, широкого контекста и флагманского мультимодального интеллекта.

Идеальные сценарии применения (Use Cases)

Масштабируемый анализ мультимедиа: Быстрое описание, классификация и поиск информации в огромных архивах изображений.
Интерактивные Vision-ассистенты: Создание отзывчивых помощников для мобильных приложений, способных «видеть» через камеру и вести диалог.
Быстрое прототипирование контента: Мгновенная генерация иллюстраций, иконок и UI-элементов на основе текстовых запросов.

Плюсы и минусы

Плюсы:

Рекордная скорость генерации ответов и изображений.
Огромное контекстное окно (400K).
Исключительная точность следования визуальным инструкциям.
Нативная мультимодальность высшего уровня.

Минусы:

В сверхсложных философских рассуждениях может уступать полноразмерным флагманам.
Ограниченное разрешение генерации по сравнению со старшими моделями серии Image.

Экосистема GPT-5 Image Mini

Сервисы, инструменты, материалы и обсуждения, связанные с моделью.

Обсуждения о GPT-5 Image Mini

Задайте вопрос сообществу — карточка модели будет прикреплена автоматически.

Создать обсуждение

GPT-5 Image Mini

Краткое описание

Агрегированный профиль

Место модели в каталоге

Подробный обзор модели

Особенности и мультимодальная мощь

Производительность и бенчмарки

Ценообразование и доступность

Идеальные сценарии применения (Use Cases)

Плюсы и минусы

Где запустить модель

Стоимость API

Профиль модели

Бенчмарки

Другие модели семейства GPT

Экосистема GPT-5 Image Mini

Где использовать

MCP и инструменты

Статьи и термины

Обсуждения о GPT-5 Image Mini