К списку моделей

Grok 4.20

4.9

От xAI

Proprietary
CTX2M
Релиз: 2026-03-31
StandardGeneralTextFrontier TOP
Официальный сайт

Краткое описание

Grok 4.20 is xAI's newest flagship model with industry-leading speed and agentic tool calling capabilities. It combines the lowest hallucination rate on the market with strict prompt adherance, delivering consistently...

Подробный обзор модели

Grok 4.20 — это новейшая флагманская модель от компании xAI, представленная в марте 2026 года. Она объединяет в себе экстремальную скорость инференса с передовыми способностями к пошаговому рассуждению и автономному использованию инструментов. Grok 4.20 устанавливает новый стандарт для индустрии, предлагая рекордно низкий уровень галлюцинаций и безупречное следование сложным, многоуровневым инструкциям при гигантском контекстном окне в 2 миллиона токенов.

Ключевые возможности Grok 4.20

Модель была специально оптимизирована для наиболее требовательных корпоративных задач и глубоких научных исследований.

  • Минимальный уровень галлюцинаций: Благодаря уникальным методам обучения на данных в реальном времени (включая социальную сеть X) и продвинутым алгоритмам верификации, Grok 4.20 демонстрирует самый низкий на рынке процент ложных утверждений в ответах.
  • Агентное мастерство и Tool Calling: Модель идеально владеет навыком выбора и использования внешних API. Она умеет самостоятельно координировать действия нескольких инструментов, проводить итеративную отладку планов и точно выполнять последовательности из десятков шагов.
  • Огромный контекст 2M: Поддержка 2 000 000 токенов позволяет модели удерживать в памяти гигантские архивы документации, целые кодовые базы крупных проектов или многолетнюю историю взаимодействий, обеспечивая безупречную связность рассуждений.

Производительность и бенчмарки

Grok 4.20 уверенно занимает лидирующие позиции в мировых рейтингах, подтверждая статус одной из самых надежных и интеллектуальных моделей четвертого поколения.

БенчмаркРезультатОписание
Arena Elo1413Высокий флагманский уровень
MATH77.2%Сильные способности в математике и логике
MMLU86.1%Глубокие общие знания и эрудиция
HumanEval83.8%Высокое качество генерации программного кода
GPQA66.8%Научные тесты PhD-уровня
SWE_bench45.9%Решение сложных инженерных задач в коде

Ценообразование и доступность

Grok 4.20 доступна через API xAI и популярных агрегаторов по цене $1.25 за 1M входных токенов и $2.50 за 1M выходных токенов. Это крайне сбалансированное предложение для флагманской модели четвертого поколения, обеспечивающее доступ к передовым технологиям «Frontier»-уровня по конкурентной цене.

Идеальные сценарии применения (Use Cases)

  • Автономные корпоративные сотрудники: Создание «умных» систем, способных самостоятельно вести сложные проекты и координировать бизнес-процессы.
  • Глубокие исследования и аудит: Автоматический сбор и систематизация данных из гигантских массивов неструктурированной информации с минимальным риском ошибок.
  • Интеллектуальная поддержка высшего уровня: Реализация ассистентов, способных помнить все детали многомесячных переписок и технических заданий.

Плюсы и минусы

Плюсы:

  • Рекордное контекстное окно (2M токенов).
  • Самый низкий в индустрии уровень галлюцинаций.
  • Исключительная точность в агентных сценариях и использовании инструментов.
  • Высокая скорость работы при флагманском интеллекте.

Минусы:

  • В задачах на чистое программирование может немного уступать специализированным кодинг-моделям серии Grok Code.
  • Проприетарная архитектура (доступ только через API xAI).

Стоимость API

$1.25 / $2.50 за 1M токенов

Профиль модели

MMLU86.1%Code83.8%Math77.2%GPQA66.8%SWE45.9%

Бенчмарки

Arena Elo (LMSYS)1413
MMLU (Общие знания)86.1%
HumanEval (Кодинг)83.8%
MATH (Математика)77.2%
GPQA (Экспертные знания)66.8%
SWE-bench (Разработка)45.9%

Другие модели семейства Grok