К списку моделей

o1-pro

4.6

От OpenAI

Proprietary
CTX200K
Релиз: 2025-03-19
ProReasoningText
Официальный сайт

Краткое описание

The o1 series of models are trained with reinforcement learning to think before they answer and perform complex reasoning. The o1-pro model uses more compute to think harder and provide...

Подробный обзор модели

OpenAI o1 Pro — это ультимативная версия архитектуры o1, предназначенная для задач, где цена ошибки критически высока, а сложность выходит за рамки возможностей стандартных моделей. Релиз режима Pro в марте 2025 года ознаменовал переход к концепции «бесконечного рассуждения», где модель может тратить минуты на обдумывание одного ответа.

Архитектура и особенности

Версия Pro отличается от базовой o1 значительно большим объемом вычислений, выделяемых на этапе генерации (inference-time compute). Это позволяет модели строить более глубокие и разветвленные деревья рассуждений.

  • Контекстное окно: 200 000 токенов.
  • Режим глубокого поиска: o1 Pro способна проверять свои выводы сотни раз, прежде чем выдать финальный результат.
  • Снижение ошибок: согласно внутренним тестам OpenAI, версия Pro совершает на 34% меньше критических ошибок в логике по сравнению с o1-preview.

Производительность и бенчмарки

В 2026 году o1 Pro удерживает лидерство в дисциплинах, требующих «чистого разума».

БенчмаркПоказательОписание
MATH 50097.0%Почти идеальное решение олимпиадной математики
GPQA Diamond74.7%Уровень аспиранта в сложных науках
LiveCodeBench67.9%Лидерство в решении новых задач программирования
MMLU Pro84.1%Глубокое понимание междисциплинарных связей

Цены и доступность

o1 Pro является одной из самых дорогих моделей на рынке, что обусловлено колоссальными затратами энергии и мощностей на каждый запрос.

  • Input: $150.00 за 1 млн токенов.
  • Output: $600.00 за 1 млн токенов.

Такая цена делает ее инструментом для исключительных случаев: когда необходимо решить фундаментальную научную проблему или провести аудит безопасности критически важного ПО.

Идеальные сценарии применения

  • Фундаментальная наука: помощь в доказательстве новых математических теорем и моделировании химических процессов.
  • Кибербезопасность: глубокий аудит смарт-контрактов и поиск сложнейших уязвимостей «нулевого дня».
  • Стратегическое планирование: анализ многолетних рыночных циклов с учетом тысяч переменных.
  • Сложная инженерия: проектирование аэрокосмических систем и микроэлектроники.

Плюсы и минусы

Плюсы:

  • Пиковая точность среди всех доступных ИИ.
  • Способность решать задачи, недоступные другим моделям.
  • Почти полное отсутствие логических провалов.

Минусы:

  • Экстремально высокая стоимость.
  • Длительное время ожидания ответа.
  • Неэффективна для простых или творческих задач.

Стоимость API

$150.00 / $600.00 за 1M токенов

Профиль модели

MMLU90.4%Code84.8%Math95%GPQA70.7%SWE50.6%

Бенчмарки

Arena Elo (LMSYS)1515
MMLU (Общие знания)90.4%
HumanEval (Кодинг)84.8%
MATH (Математика)95%
GPQA (Экспертные знания)70.7%
SWE-bench (Разработка)50.6%

Другие модели семейства Other