К списку моделей

GPT-5.1-Codex

4.3

От OpenAI

Proprietary
CTX400K
Релиз: 2025-11-13
StandardGeneralMultimodal
Официальный сайт

Краткое описание

GPT-5.1-Codex is a specialized version of GPT-5.1 optimized for software engineering and coding workflows. It is designed for both interactive development sessions and long, independent execution of complex engineering tasks....

Подробный обзор модели

GPT-5.1 Codex — это высокоспециализированная языковая модель от OpenAI, созданная на базе флагманского интеллекта серии 5.1 и оптимизированная специально для программной инженерии и управления агентными ворклоу. Представленная в ноябре 2025 года, она предлагает разработчикам мощный инструмент, способный как к интерактивной поддержке в чате, так и к длительному автономному выполнению сложных инженерных заданий.

Особенности и программный интеллект

Версия 5.1 Codex является прямым ответом на запрос рынка в надежных инструментах для автоматизации полного цикла разработки ПО.

  • Ориентация на автономность: Модель была специально дообучена для работы в составе кодинг-агентов. Она демонстрирует высокую стабильность при управлении инструментами сборки, запуске тестов и итеративном исправлении ошибок на основе логов компилятора.
  • Глубокое понимание архитектуры: В отличие от универсальных моделей, GPT-5.1 Codex лучше осознает зависимости внутри крупных проектов. Она умеет проводить осмысленный рефакторинг целых модулей, учитывая влияние изменений на всю систему в рамках гигантского 400K контекста.
  • Мультимодальный аудит: Модель способна анализировать не только текст кода, но и визуальные материалы (схемы баз данных, архитектурные диаграммы, UI-прототипы), обеспечивая комплексный подход к проектированию и проверке ПО.

Производительность и бенчмарки

GPT-5.1 Codex занимает лидирующие позиции в инженерных рейтингах, показывая результаты на уровне лучших профессиональных стандартов индустрии.

БенчмаркРезультатОписание
HumanEval91.1%Топовый уровень генерации программного кода
Arena Elo1431Высокий профессиональный уровень
MMLU87.6%Общие знания и эрудиция
MATH88.1%Математические способности и логика
SWE_bench55.7%Автономное решение инженерных задач
GPQA64.0%Научные тесты университетского уровня

Ценообразование и доступность

Модель доступна через API по цене $1.25 за 1M входных токенов и $10.00 за 1M выходных токенов. Это премиальное решение для команд разработки и компаний, стремящихся максимально автоматизировать процессы написания и аудита кода с использованием передовых достижений OpenAI.

Идеальные сценарии применения (Use Cases)

  • AI Software Engineer: Создание автономных систем для ведения тикетов, написания фич и исправления багов.
  • Глубокий рефакторинг и миграция: Перенос крупных легаси-систем на новые стеки технологий с автоматической верификацией.
  • Интеллектуальный аудит безопасности: Поиск сложных логических уязвимостей в коде и архитектуре систем.

Плюсы и минусы

Плюсы:

  • Исключительная точность в задачах программирования.
  • Огромное контекстное окно (400K токенов).
  • Стабильность в агентных сценариях использования.
  • Нативная мультимодальность (понимание технических диаграмм).

Минусы:

  • Высокая стоимость выходных токенов.
  • Требует четко структурированных инструкций для достижения максимальной точности в автономных задачах.

Стоимость API

$1.25 / $10.00 за 1M токенов

Профиль модели

MMLU87.6%Code91.1%Math88.1%GPQA64%SWE55.7%

Бенчмарки

Arena Elo (LMSYS)1431
MMLU (Общие знания)87.6%
HumanEval (Кодинг)91.1%
MATH (Математика)88.1%
GPQA (Экспертные знания)64%
SWE-bench (Разработка)55.7%

Другие модели семейства GPT