К списку моделей

gpt-oss-120b

4.2

От OpenAI

Proprietary
CTX131K
Релиз: 2025-08-05
StandardGeneralText
Официальный сайт

Краткое описание

gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases. It activates 5.1B parameters per forward pass and is optimized...

Подробный обзор модели

gpt-oss-120b (также известная как GPT-OSS 1.0) — это первая в истории OpenAI крупная языковая модель с открытыми весами (open-weight), представленная в августе 2025 года. Обладая архитектурой Mixture-of-Experts (MoE) с общим объемом в 117 миллиардов параметров, модель была специально оптимизирована для задач, требующих глубокого рассуждения, автономного управления агентами и высокой производительности в кодинге, предлагая открытую альтернативу проприетарным флагманам.

Архитектура и стратегия OpenAI

Выпуск gpt-oss-120b стал важным стратегическим шагом OpenAI в ответ на растущую популярность серий Llama и Qwen.

  • Масштабируемая MoE: Из общего объема 117B параметров, в процессе генерации каждого токена активируется всего 5.1 миллиарда. Это позволяет модели демонстрировать интеллект уровня 100B+ систем при скорости работы и стоимости инференса, характерных для компактных моделей.
  • Ориентация на агентов: Модель изначально проектировалась для интеграции в автономные системы. Она обладает нативной поддержкой сложного выбора инструментов (Tool Selection) и высокой точностью выполнения многошаговых инструкций.
  • Контекстное окно 131K: Поддержка широкого контекста в сочетании с оптимизированными механизмами внимания (Attention) делает gpt-oss-120b идеальной для анализа крупных проектов и документов.

Производительность и бенчмарки

Модель устанавливает новые рекорды для открытых систем в области логики и программирования, вплотную приближаясь к закрытым флагманам прошлого года.

БенчмаркРезультатОписание
Arena Elo1440Топ-уровень открытых моделей
HumanEval93.7%Исключительное качество генерации кода
MMLU88.3%Глубокая эрудиция и общие знания
MATH88.7%Математические способности и логика
GPQA68.3%Научные вопросы PhD-уровня
SWE_bench57.0%Решение прикладных инженерных задач

Ценообразование и доступность

Будучи открытой моделью, gpt-oss-120b доступна для скачивания и локального развертывания. Через облачные API (например, OpenRouter) она предлагается по крайне агрессивной цене: всего $0.04 за 1M входных токенов и $0.18 за 1M выходных токенов, что делает её одной из самых экономичных моделей «Frontier»-класса в мире.

Идеальные сценарии применения (Use Cases)

  • Создание автономных ИИ-агентов: Использование в качестве ядра систем, самостоятельно управляющих рабочими процессами.
  • Профессиональная разработка ПО: Автоматизация написания кода, рефакторинг и аудит безопасности в крупных репозиториях.
  • Корпоративные базы знаний: Построение надежных RAG-систем с полным контролем над весами модели и данными.

Плюсы и минусы

Плюсы:

  • Рекордное соотношение интеллекта и стоимости инференса.
  • Открытые веса от лидера индустрии (OpenAI).
  • Феноменальная точность в задачах программирования.
  • Низкая задержка благодаря MoE-архитектуре.

Минусы:

  • Требует значительных мощностей для локального запуска (несмотря на MoE).
  • Фокус на текст, мультимодальные возможности в первой версии ограничены.

Стоимость API

$0.04 / $0.18 за 1M токенов

Профиль модели

MMLU88.3%Code93.7%Math88.7%GPQA68.3%SWE57%

Бенчмарки

Arena Elo (LMSYS)1440
MMLU (Общие знания)88.3%
HumanEval (Кодинг)93.7%
MATH (Математика)88.7%
GPQA (Экспертные знания)68.3%
SWE-bench (Разработка)57%

Другие модели семейства GPT