К списку моделей

Claude 3.7 Sonnet

4.4

От Anthropic

Proprietary
CTX200K
Релиз: 2025-02-24
StandardGeneralText
Официальный сайт

Краткое описание

Claude 3.7 Sonnet is an advanced large language model with improved reasoning, coding, and problem-solving capabilities. It introduces a hybrid reasoning approach, allowing users to choose between rapid responses and...

Подробный обзор модели

Claude 3.7 Sonnet, представленная в феврале 2025 года, стала первой моделью от Anthropic, объединившей мгновенную генерацию с возможностью глубокого рассуждения. Это превратило Sonnet из простого чат-бота в мощнейший движок для автономных агентов.

Архитектура и особенности

Главная новинка — режим «Extended Thinking» (Расширенное мышление). Пользователь может сам устанавливать «бюджет на раздумья», позволяя модели тратить больше времени на планирование и верификацию ответов.

  • Контекстное окно: 200 000 токенов (вход) / 128 000 (выход).
  • Визуальное понимание: Claude 3.7 сохраняет лидерство в анализе графиков, диаграмм и скриншотов интерфейсов.
  • Агентная мощь: благодаря глубокой логике, модель стала основной для большинства систем автономного кодинга в 2026 году.

Производительность и бенчмарки

В режиме расширенного мышления Claude 3.7 Sonnet показывает результаты, ранее казавшиеся недостижимыми для моделей такого класса.

БенчмаркПоказательОписание
SWE-bench Verified70.3%Мировой рекорд в решении задач на GitHub
GPQA Diamond84.8%Глубокое понимание научной литературы
AIME 202480.0%Олимпиадная математика
IFEval93.2%Безупречное следование сложным промптам

Цены и доступность

Anthropic сохранила агрессивную ценовую политику, делая Sonnet 3.7 доступной для широкого круга задач.

  • Input: $3.00 за 1 млн токенов.
  • Output: $15.00 за 1 млн токенов.

Идеальные сценарии применения

  • Автономный кодинг: создание целых модулей ПО с минимальным вмешательством человека.
  • Сложный анализ документов: работа с многостраничными PDF, поиск связей и противоречий.
  • Анализ интерфейсов: проектирование и тестирование UI/UX на основе скриншотов.
  • Научная работа: помощь в рецензировании статей и синтезе новых данных.

Плюсы и минусы

Плюсы:

  • Лучшая модель для агентного программирования.
  • Управляемый режим рассуждений.
  • Исключительная визуальная грамотность.
  • Высокая надежность и отсутствие «галлюцинаций».

Минусы:

  • Режим Extended Thinking может значительно замедлять работу.
  • Требует четких промптов для раскрытия всего потенциала.

Стоимость API

$3.00 / $15.00 за 1M токенов

Профиль модели

MMLU90.5%Code92.7%Math85.8%GPQA75.4%SWE52.8%

Бенчмарки

Arena Elo (LMSYS)1466
MMLU (Общие знания)90.5%
HumanEval (Кодинг)92.7%
MATH (Математика)85.8%
GPQA (Экспертные знания)75.4%
SWE-bench (Разработка)52.8%

Другие модели семейства Claude