Name: o1-pro
Author: OpenAI

Краткое описание

Модели серии o1 обучены с подкреплением думать, прежде чем отвечать, и выполнять сложные рассуждения. Модель o1-pro использует больше вычислительных ресурсов, чтобы лучше думать и предоставлять...

Агрегированный профиль

o1-pro сильнее всего выглядит в категории «рассуждения». Индекс 85/100 рассчитан по процентильным позициям в 3 сопоставимых тестах; уверенность — средняя. Это навигационная оценка, а не замена тесту на ваших задачах.

Рассуждения85/100

3 сопоставимых теста · уверенность: средняя

Код38/100

2 сопоставимых теста · уверенность: средняя

Как рассчитан профиль →

Место модели в каталоге

Позиция рассчитана только среди моделей, для которых в каталоге указан результат того же теста. Это помогает сравнивать карточки, но не заменяет проверку модели на вашей задаче.

Бенчмарк	Результат	Место	Доказательство
Arena Elo (LMSYS)	1515	41 из 384	Источник не указан
MMLU (Общие знания)	90.4%	54 из 391	Источник не указан
HumanEval (Кодинг)	84.8%	232 из 391	Источник не указан
MATH (Математика)	95%	39 из 391	Источник не указан
GPQA (Экспертные знания)	70.7%	84 из 390	Источник не указан
SWE-bench (Разработка)	50.6%	242 из 381	Источник не указан

Подробный обзор модели

OpenAI o1 Pro — это ультимативная версия архитектуры o1, предназначенная для задач, где цена ошибки критически высока, а сложность выходит за рамки возможностей стандартных моделей. Релиз режима Pro в марте 2025 года ознаменовал переход к концепции «бесконечного рассуждения», где модель может тратить минуты на обдумывание одного ответа.

Архитектура и особенности

Версия Pro отличается от базовой o1 значительно большим объемом вычислений, выделяемых на этапе генерации (inference-time compute). Это позволяет модели строить более глубокие и разветвленные деревья рассуждений.

Контекстное окно: 200 000 токенов.
Режим глубокого поиска: o1 Pro способна проверять свои выводы сотни раз, прежде чем выдать финальный результат.
Снижение ошибок: согласно внутренним тестам OpenAI, версия Pro совершает на 34% меньше критических ошибок в логике по сравнению с o1-preview.

Производительность и бенчмарки

В 2026 году o1 Pro удерживает лидерство в дисциплинах, требующих «чистого разума».

Бенчмарк	Показатель	Описание
MATH 500	97.0%	Почти идеальное решение олимпиадной математики
GPQA Diamond	74.7%	Уровень аспиранта в сложных науках
LiveCodeBench	67.9%	Лидерство в решении новых задач программирования
MMLU Pro	84.1%	Глубокое понимание междисциплинарных связей

Цены и доступность

o1 Pro является одной из самых дорогих моделей на рынке, что обусловлено колоссальными затратами энергии и мощностей на каждый запрос.

Input: $150.00 за 1 млн токенов.
Output: $600.00 за 1 млн токенов.

Такая цена делает ее инструментом для исключительных случаев: когда необходимо решить фундаментальную научную проблему или провести аудит безопасности критически важного ПО.

Идеальные сценарии применения

Фундаментальная наука: помощь в доказательстве новых математических теорем и моделировании химических процессов.
Кибербезопасность: глубокий аудит смарт-контрактов и поиск сложнейших уязвимостей «нулевого дня».
Стратегическое планирование: анализ многолетних рыночных циклов с учетом тысяч переменных.
Сложная инженерия: проектирование аэрокосмических систем и микроэлектроники.