От Anthropic
Claude 3.7 Sonnet is an advanced large language model with improved reasoning, coding, and problem-solving capabilities. It introduces a hybrid reasoning approach, allowing users to choose between rapid responses and...
Claude 3.7 Sonnet, представленная в феврале 2025 года, стала первой моделью от Anthropic, объединившей мгновенную генерацию с возможностью глубокого рассуждения. Это превратило Sonnet из простого чат-бота в мощнейший движок для автономных агентов.
Главная новинка — режим «Extended Thinking» (Расширенное мышление). Пользователь может сам устанавливать «бюджет на раздумья», позволяя модели тратить больше времени на планирование и верификацию ответов.
В режиме расширенного мышления Claude 3.7 Sonnet показывает результаты, ранее казавшиеся недостижимыми для моделей такого класса.
| Бенчмарк | Показатель | Описание |
|---|---|---|
| SWE-bench Verified | 70.3% | Мировой рекорд в решении задач на GitHub |
| GPQA Diamond | 84.8% | Глубокое понимание научной литературы |
| AIME 2024 | 80.0% | Олимпиадная математика |
| IFEval | 93.2% | Безупречное следование сложным промптам |
Anthropic сохранила агрессивную ценовую политику, делая Sonnet 3.7 доступной для широкого круга задач.
Плюсы:
Минусы:
$3.00 / $15.00 за 1M токенов