К списку моделей

o3 Mini

4.3

От OpenAI

Proprietary
CTX200K
Релиз: 2025-01-31
FastReasoningTextFrontier Reasoning
Официальный сайт

Краткое описание

OpenAI o3-mini — это эффективная модель, специализирующаяся на рассуждениях в области точных наук (STEM), математики и кодинга. Она поддерживает параметр reasoning_effort для настройки глубины обдумывания задачи.

Подробный обзор модели

o3-mini — это высокоэффективная языковая модель от OpenAI, специализирующаяся на глубоком логическом рассуждении в областях STEM (наука, технологии, инженерия и математика). Представленная в январе 2025 года, она стала важной вехой в развитии «рассуждающих» моделей, предлагая возможности флагманской серии o1 при значительно более низкой задержке и стоимости использования.

Архитектура и механизм рассуждения

Модель o3-mini построена на базе рефлексивной архитектуры, использующей масштабное обучение с подкреплением (Reinforcement Learning). В отличие от классических моделей, o3-mini генерирует скрытую цепочку мыслей (Chain-of-Thought) перед выдачей окончательного ответа.

  • Thinking Effort: Разработчикам доступен уникальный параметр reasoning_effort (Low, Medium, High). Он позволяет гибко настраивать глубину «обдумывания» задачи: от быстрых ответов для простых скриптов до глубокого анализа олимпиадных математических задач.
  • Инструментарий разработчика: o3-mini изначально поддерживает вызов функций (Function Calling), структурированный вывод (Structured Outputs) и системные сообщения, что делает её идеальным выбором для сложных агентных систем.
  • Контекстное окно: Модель поддерживает 200 000 токенов и способна генерировать до 100 000 токенов в одном ответе, что позволяет решать масштабные задачи по написанию документации или анализу кода.

Производительность и бенчмарки

o3-mini демонстрирует исключительные результаты в технических дисциплинах, зачастую превосходя гораздо более тяжелые и дорогие модели предыдущих поколений.

БенчмаркРезультатОписание
Arena Elo1320Высокий уровень специализированных моделей
MMLU78.3%Общие знания и эрудиция
HumanEval69.3%Точность в программировании (базовая)
MATH79.9%Решение сложных математических задач
GPQA61.1%Научные вопросы PhD-уровня
AIME 202487.3%Олимпиадная математика (High Effort)

Ценообразование и доступность

o3-mini позиционируется как «экономичное рассуждение». При цене $1.10 за 1M входных токенов и $4.40 за 1M выходных токенов, она примерно в 14 раз дешевле флагманской модели o1, при этом превосходя её в скорости и эффективности в ряде STEM-задач.

Идеальные сценарии применения (Use Cases)

  • Математическое и научное моделирование: Решение сложных уравнений, проверка гипотез и помощь в академических исследованиях.
  • Профессиональный кодинг: Написание сложных алгоритмов, отладка логики и генерация тестов с высокой степенью верификации.
  • Агентные ворклоу: Использование в качестве ядра автономных систем, где требуется точное пошаговое планирование и использование внешних API.

Плюсы и минусы

Плюсы:

  • Рекордная точность в задачах на логику и математику.
  • Возможность управления временем рассуждения (effort).
  • Полная поддержка всех инструментов разработчика (Function Calling и др.).
  • Огромный объем генерации в одном ответе (100K).

Минусы:

  • Более высокая задержка по сравнению с GPT-4o mini из-за фазы «мышления».
  • В гуманитарных и творческих задачах может уступать моделям серии «Omni».

Стоимость API

$1.10 / $4.40 за 1M токенов

Профиль модели

MMLU78.3%Code69.3%Math79.9%GPQA61.1%SWE32.9%

Бенчмарки

Arena Elo (LMSYS)1320
MMLU (Общие знания)78.3%
HumanEval (Кодинг)69.3%
MATH (Математика)79.9%
GPQA (Экспертные знания)61.1%
SWE-bench (Разработка)32.9%

Другие модели семейства Other