К списку моделей

gpt-oss-120b (free)

4.5

От OpenAI

Proprietary
CTX131K
Релиз: 2025-08-05
StandardGeneralText
Официальный сайт

Краткое описание

gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases. It activates 5.1B parameters per forward pass and is optimized...

Подробный обзор модели

gpt-oss-120b — это первая в истории OpenAI крупная языковая модель с открытыми весами (open-weight), представленная в августе 2025 года. Обладая архитектурой Mixture-of-Experts (MoE) с общим объемом в 117 миллиардов параметров, модель активирует всего 5.1 миллиарда на каждом шаге, что обеспечивает рекордную скорость работы и низкую стоимость инференса при сохранении интеллекта флагманского уровня. gpt-oss-120b была специально оптимизирована для задач, требующих глубокого рассуждения, автономного управления агентами и высокой производительности в кодинге.

Архитектура и открытая стратегия OpenAI

Выпуск gpt-oss-120b стал важным стратегическим шагом OpenAI в ответ на растущую популярность серий Llama и Qwen.

  • Сверхэффективная MoE: Активация лишь 5.1B параметров из 117B позволяет модели демонстрировать интеллект уровня 100B+ систем при скорости работы и стоимости инференса, характерных для компактных моделей. Это делает её идеальным выбором для массовых производственных нагрузок.
  • Агентный потенциал: Модель изначально проектировалась для интеграции в автономные системы. Она обладает нативной поддержкой сложного выбора инструментов (Tool Selection) и высокой точностью выполнения многошаговых инструкций.
  • Широкий контекст 131K: Поддержка расширенного контекстного окна в сочетании с оптимизированными механизмами внимания делает gpt-oss-120b идеальной для анализа крупных проектов и объемной документации.

Производительность и бенчмарки

Модель устанавливает новые рекорды для открытых систем в области логики и программирования, вплотную приближаясь к закрытым флагманам лидера индустрии.

БенчмаркРезультатОписание
Arena Elo1404Топ-уровень открытых моделей
HumanEval84.7%Исключительное качество генерации кода
MMLU85.3%Глубокая эрудиция и общие знания
MATH83.8%Сильные способности в математике и логике
GPQA64.4%Научные вопросы PhD-уровня
SWE_bench50.4%Решение прикладных инженерных задач

Доступность и цена

Бесплатная версия gpt-oss-120b доступна через API популярных агрегаторов (например, OpenRouter), что делает её уникальным инструментом для разработчиков. Это дает возможность использовать мощь 117B модели от OpenAI с нулевыми затратами на API, совершая революцию в доступности передовых технологий.

Идеальные сценарии применения (Use Cases)

  • Создание автономных ИИ-агентов: Использование в качестве ядра систем, самостоятельно управляющих рабочими процессами через API.
  • Профессиональная разработка ПО: Автоматизация написания кода, рефакторинг и аудит безопасности в крупных репозиториях.
  • Корпоративные базы знаний: Построение надежных RAG-систем на гигантских объемах внутренних документов с полным контролем над данными.

Плюсы и минусы

Плюсы:

  • Рекордное соотношение интеллекта и стоимости инференса.
  • Полностью бесплатный доступ по API.
  • Феноменальная точность в агентных сценариях и кодинге.
  • Открытые веса от лидера индустрии.

Минусы:

  • Требует значительных мощностей для локального запуска (несмотря на MoE).
  • Фокус на текст, мультимодальные возможности в первой версии ограничены.

Стоимость API

$0.00 / $0.00 за 1M токенов

Профиль модели

MMLU85.3%Code84.7%Math83.8%GPQA64.4%SWE50.4%

Бенчмарки

Arena Elo (LMSYS)1404
MMLU (Общие знания)85.3%
HumanEval (Кодинг)84.7%
MATH (Математика)83.8%
GPQA (Экспертные знания)64.4%
SWE-bench (Разработка)50.4%

Другие модели семейства GPT