К списку моделей

GPT-5.4 Image 2

4.5

От OpenAI

Proprietary
CTX272K
Релиз: 2026-04-21
StandardGeneralTextFrontier Medium
Официальный сайт

Краткое описание

[GPT-5.4](https://openrouter.ai/openai/gpt-5.4) Image 2 combines OpenAI's GPT-5.4 model with state-of-the-art image generation capabilities from GPT Image 2. It enables rich multimodal workflows, allowing users to seamlessly move between reasoning, coding, and...

Подробный обзор модели

Обзор OpenAI GPT-5.4 Image 2: Новая эра мультимодальности (2026)

GPT-5.4 Image 2 — это флагманская мультимодальная модель от OpenAI, объединяющая в себе мощнейший интеллект поколения 5.4 и революционные возможности генерации изображений GPT Image 2. Эта модель создана для бесшовной работы в рамках единого рабочего процесса, где пользователь может свободно переключаться между рассуждениями, написанием кода и созданием сложного визуального контента.

Ключевые возможности GPT-5.4 Image 2

1. Бесшовная мультимодальная интеграция

Главное отличие версии 5.4 Image 2 — это отсутствие барьеров между текстовым и визуальным интеллектом. Модель способна не просто генерировать картинки по описанию, но и глубоко понимать визуальный контекст предоставленных изображений, учитывая его при решении логических и программных задач.

2. Фотореализм и следование инструкциям

Благодаря ядру GPT Image 2, модель достигла нового уровня качества графики. Она безупречно передает текстуры, освещение и сложные анатомические подробности. Точность следования пространственным инструкциям (например, «расположи объект А слева от Б, но за объектом В») стала практически абсолютной.

3. Расширенный контекст 272K

Поддержка контекстного окна в 272 000 токенов позволяет модели удерживать в памяти гигантские объемы информации о визуальных проектах, включая детальные описания миров, персонажей и длинные истории, обеспечивая визуальную согласованность на протяжении всей работы.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат GPT-5.4 Image 2Категория
Arena Elo1464Флагманский уровень
MMLU90.3%Общие знания
HumanEval89.5%Написание кода
MATH94.0%Математика и логика
GPQA71.0%Научные вопросы
SWE_bench50.5%Решение инженерных задач

Сценарии использования

  • Полный цикл разработки контента: От написания сценария и кода до генерации финальных иллюстраций и дизайна интерфейсов.
  • Интеллектуальный анализ мультимедиа: Поиск и классификация информации в огромных архивах изображений и видео с учетом сложных текстовых условий.
  • Визуальное программирование: Помощь в создании графических приложений, игр и UI-компонентов с мгновенной визуализацией результата.

Доступность и цена

GPT-5.4 Image 2 доступна через API по цене $8.00 за 1M входных токенов. Это премиальное, но высокоэффективное решение для профессионалов и студий, которым требуется максимальная синергия текста и изображения в одном ИИ-инструменте.


Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

Стоимость API

$8.00 / $15.00 за 1M токенов

Профиль модели

MMLU90.3%Code89.5%Math94%GPQA71%SWE50.5%

Бенчмарки

Arena Elo (LMSYS)1464
MMLU (Общие знания)90.3%
HumanEval (Кодинг)89.5%
MATH (Математика)94%
GPQA (Экспертные знания)71%
SWE-bench (Разработка)50.5%

Другие модели семейства GPT