Name: Goliath 120B
Author: Alpindale

Краткое описание

Большой LLM, созданный путем объединения двух точно настроенных моделей Llama 70B в одну модель 120B. Объединяет Xwin и Euryale. Благодарность - [@chargoddard](https://huggingface.co/chargoddard) за разработку структуры, используемой для слияния...

Агрегированный профиль

Goliath 120B сильнее всего выглядит в категории «рассуждения». Индекс 37/100 рассчитан по процентильным позициям в 3 сопоставимых тестах; уверенность — средняя. Это навигационная оценка, а не замена тесту на ваших задачах.

Рассуждения37/100

3 сопоставимых теста · уверенность: средняя

Код23/100

2 сопоставимых теста · уверенность: средняя

Как рассчитан профиль →

Место модели в каталоге

Позиция рассчитана только среди моделей, для которых в каталоге указан результат того же теста. Это помогает сравнивать карточки, но не заменяет проверку модели на вашей задаче.

Бенчмарк	Результат	Место	Доказательство
Arena Elo (LMSYS)	1417	192 из 384	Источник не указан
MMLU (Общие знания)	86.4%	190 из 391	Источник не указан
HumanEval (Кодинг)	82.9%	274 из 391	Источник не указан
MATH (Математика)	78.6%	288 из 391	Источник не указан
GPQA (Экспертные знания)	63.8%	256 из 390	Источник не указан
SWE-bench (Разработка)	46%	320 из 381	Источник не указан

Подробный обзор модели

Goliath 120B — это высокопроизводительная языковая модель, представляющая собой результат сложного слияния (merge) двух профессионально дообученных версий Llama 70B. Созданная разработчиком Alpindale с использованием инновационного фреймворка для мерджа моделей, Goliath 120B стала легендарной в сообществе благодаря своей исключительной глубине рассуждений, богатому литературному стилю и «человечности» ответов, недоступной многим базовым моделям аналогичного размера.

Особенности и метод слияния

Модель Goliath 120B была создана путем объединения весов моделей Xwin 70B и Euryale 70B, каждая из которых была лучшей в своём сегменте (логика и творчество соответственно).

Интеллектуальная синергия: Благодаря уникальной методике слияния, Goliath 120B унаследовала строгую логику и мастерство следования инструкциям от Xwin, а также богатый словарный запас и «авторское» чутье от Euryale. Результатом стала модель, которая одинаково эффективна как в решении технических задач, так и в написании художественной прозы.
Глубина рассуждений: С 120 миллиардами параметров модель обладает огромным интеллектуальным потенциалом, позволяющим ей улавливать тончайшие нюансы контекста и строить длинные, логически безупречные цепочки выводов.
Оптимизация для Roleplay: Goliath 120B признана одной из лучших моделей для сложного ролевого взаимодействия, создания реалистичных персонажей и ведения длительных интерактивных историй.

Производительность и бенчмарки

Goliath 120B демонстрирует стабильно высокие результаты в тестах на общие знания и творческое письмо, становясь эталоном для моделей на базе мерджа.

Бенчмарк	Результат	Описание
Arena Elo	1417	Высокий профессиональный уровень
MMLU	86.4%	Глубокие общие знания и эрудиция
HumanEval	82.9%	Хорошее качество генерации программного кода
GPQA	63.8%	Научные вопросы PhD-уровня
MATH	78.6%	Хорошие способности в математике и логике
SWE_bench	46.0%	Решение инженерных задач

Ценообразование и доступность

Модель доступна через API популярных агрегаторов (например, OpenRouter) по цене $3.75 за 1M входных токенов и $7.50 за 1M выходных токенов. Это премиальное решение для тех, кто ищет бескомпромиссное качество текста и глубину «личности» ИИ для специфических творческих и аналитических задач.

Идеальные сценарии применения (Use Cases)

Глубокий Roleplay и сторителлинг: Создание максимально реалистичных ИИ-персонажей и проведение эпических текстовых приключений.
Художественное письмо и редактура: Помощь авторам в написании книг, сценариев и создании уникальных стилей изложения.
Сложный гуманитарный анализ: Глубокая проработка философских, психологических и социальных тем с высокой степенью детализации.