К списку моделей

GPT-4o (2024-05-13)

4.2

От OpenAI

Proprietary
CTX128K
Релиз: 2024-05-13
StandardGeneralText
Официальный сайт

Краткое описание

GPT-4o ("o" for "omni") is OpenAI's latest AI model, supporting both text and image inputs with text outputs. It maintains the intelligence level of [GPT-4 Turbo](/models/openai/gpt-4-turbo) while being twice as...

Подробный обзор модели

GPT-4o (версия 2024-05-13) — это оригинальный релиз революционной мультимодальной модели от OpenAI, впервые представивший миру концепцию «Omni» интеллекта. Именно эта итерация заложила фундамент для бесшовного взаимодействия человека и ИИ в реальном времени, объединив способности к обработке текста, изображений и аудио в рамках единого нейросетевого пайплайна с рекордно низкой задержкой ответа.

Особенности и технологический прорыв

Выход версии 2024-05-13 стал поворотным моментом в индустрии, предложив флагманский интеллект в два раза быстрее и в два раза дешевле предыдущей GPT-4 Turbo.

  • Нативная мультимодальность: Впервые модель была обучена обрабатывать различные типы данных (текст + изображения) нативно, без использования внешних модулей «зрения». Это позволило GPT-4o понимать пространственные взаимосвязи и мелкие детали на фото и видео с исключительной точностью.
  • Эмоциональный интеллект: Модель была специально оптимизирована для ведения естественных диалогов, научившись распознавать интонации голоса и подстраивать свой тон под настроение пользователя.
  • Широкий контекст 128K: Поддержка контекстного окна до 128 000 токенов позволила пользователям анализировать длинные документы и цепочки сообщений, сохраняя идеальную связность повествования.

Производительность и бенчмарки

Оригинальная GPT-4o сразу после выхода заняла первое место в мировых рейтингах, установив новые стандарты для мультимодальных систем.

БенчмаркРезультатОписание
Arena Elo1416Топ-уровень мировых флагманов 2024 года
MMLU86.3%Глубокие общие знания и эрудиция
HumanEval80.0%Высокое качество генерации программного кода
MATH73.4%Хорошие способности в математике и логике
GPQA63.6%Научные вопросы PhD-уровня
SWE_bench49.6%Решение инженерных задач в коде

Ценообразование и доступность

GPT-4o (2024-05-13) доступна через API OpenAI и популярных агрегаторов по цене $5.00 за 1M входных токенов и $15.00 за 1M выходных токенов. Она остается востребованным и стабильным решением для тех, кому важен оригинальный опыт взаимодействия с Omni-моделью OpenAI.

Идеальные сценарии применения (Use Cases)

  • Интерактивные ИИ-ассистенты: Создание помощников, способных полноценно «видеть» через камеру и вести живой диалог.
  • Анализ мультимедийного контента: Быстрая обработка фото, скриншотов и видео с извлечением сложных смыслов.
  • Многоязычная поддержка: Профессиональный перевод и локализация контента с сохранением культурных нюансов.

Плюсы и минусы

Плюсы:

  • Первая в мире по-настоящему мультимодальная Omni-модель.
  • Высокая скорость генерации и низкая задержка.
  • Исключительное понимание визуального контекста.
  • Проверенная временем стабильность.

Минусы:

  • Высокая стоимость API по сравнению с версиями 2025-2026 годов.
  • Уступает более поздним итерациям (08-06 и др.) в задачах на структурированный вывод.

Стоимость API

$5.00 / $15.00 за 1M токенов

Профиль модели

MMLU86.3%Code80%Math73.4%GPQA63.6%SWE49.6%

Бенчмарки

Arena Elo (LMSYS)1416
MMLU (Общие знания)86.3%
HumanEval (Кодинг)80%
MATH (Математика)73.4%
GPQA (Экспертные знания)63.6%
SWE-bench (Разработка)49.6%

Другие модели семейства GPT