К списку моделей

Claude Opus 4.8

От Anthropic

Proprietary
CTX1M
Релиз: 2026-05-28
ProGeneralMultimodalFrontier TOP
Официальный сайт

Краткое описание

Claude Opus 4.8 — новейшая модель от Anthropic, выпущенная в мае 2026 года. Разработана специально для сложных агентных процессов, написания надежного кода и обработки сверхдлинных контекстов. Модель в 4 раза реже пропускает собственные ошибки в коде и набрала 69.2% в бенчмарке SWE-Bench Pro.

Подробный обзор модели

Обзор Claude Opus 4.8

Claude Opus 4.8 — это новейшая модель от Anthropic, выпущенная 28 мая 2026 года. Она позиционируется как «ощутимое улучшение» по сравнению со своим предшественником, Opus 4.7, и фокусируется на развитии агентных возможностей, надежности в написании кода и обработке длинного контекста.

Ключевые улучшения и бенчмарки

  • SWE-Bench Pro (Написание кода): Claude Opus 4.8 достигла результата 69.2% (по сравнению с 64.3% у Opus 4.7). Модель устанавливает новые стандарты в области автономного программирования и агентных задач.
  • MMLU-Pro: Модель показывает точность около 89.6%.
  • Arena Elo: В общих рейтингах Chatbot Arena модель получила оценку в районе 1590-1600, укрепляя позиции Anthropic в топе лидеров.
  • Агентные способности (Agentic Capabilities): Внутренние тесты Anthropic показали, что Opus 4.8 стала единственной моделью, которая смогла пройти все тестовые кейсы от начала до конца в бенчмарке "Super-Agent", а также набрала 84% в бенчмарке Online-Mind2Web, проверяющем использование компьютера ИИ.

Новые возможности

  1. Честность и надежность в коде: Главный фокус релиза — существенное снижение галлюцинаций в фактах и дефектов в коде. Anthropic заявляет, что Opus 4.8 примерно в 4 раза реже пропускает собственные ошибки в сгенерированном коде по сравнению с Opus 4.7.
  2. Динамические воркфлоу (Dynamic Workflows): Модель получила полноценную поддержку динамических рабочих процессов в Claude Code. Это позволяет ей автономно планировать и оркестрировать сотни параллельных подагентов.
  3. Режим Fast Mode: Цены остались на уровне Opus 4.7 ($5 за миллион токенов ввода и $25 за миллион вывода), однако был добавлен новый режим "Fast Mode". Он в 2.5 раза быстрее и в 3 раза дешевле, чем Fast Mode в предыдущих версиях.

Заключение

Claude Opus 4.8 не стала революционным скачком, но предложила пользователям ровно то, что было необходимо: невероятную надежность в программировании, возможность создания сложных агентных цепочек и улучшенную работу с длинными контекстами. Для команд разработки и бизнеса, интегрирующего ИИ, Opus 4.8 становится одним из самых стабильных решений на рынке в 2026 году.

Стоимость API

$5.00 / $25.00 за 1M токенов

Профиль модели

MMLU96.5%Code88.4%Math92.1%GPQA78.5%SWE69.2%

Бенчмарки

Arena Elo (LMSYS)1589
MMLU (Общие знания)96.5%
HumanEval (Кодинг)88.4%
MATH (Математика)92.1%
GPQA (Экспертные знания)78.5%
SWE-bench (Разработка)69.2%

Другие модели семейства Claude