К списку моделей

Goliath 120B

5.0

От Alpindale

Proprietary
CTX6K
Релиз: 2023-11-10
StandardGeneralText
Официальный сайт

Краткое описание

A large LLM created by combining two fine-tuned Llama 70B models into one 120B model. Combines Xwin and Euryale. Credits to - [@chargoddard](https://huggingface.co/chargoddard) for developing the framework used to merge...

Подробный обзор модели

Goliath 120B — это высокопроизводительная языковая модель, представляющая собой результат сложного слияния (merge) двух профессионально дообученных версий Llama 70B. Созданная разработчиком Alpindale с использованием инновационного фреймворка для мерджа моделей, Goliath 120B стала легендарной в сообществе благодаря своей исключительной глубине рассуждений, богатому литературному стилю и «человечности» ответов, недоступной многим базовым моделям аналогичного размера.

Особенности и метод слияния

Модель Goliath 120B была создана путем объединения весов моделей Xwin 70B и Euryale 70B, каждая из которых была лучшей в своём сегменте (логика и творчество соответственно).

  • Интеллектуальная синергия: Благодаря уникальной методике слияния, Goliath 120B унаследовала строгую логику и мастерство следования инструкциям от Xwin, а также богатый словарный запас и «авторское» чутье от Euryale. Результатом стала модель, которая одинаково эффективна как в решении технических задач, так и в написании художественной прозы.
  • Глубина рассуждений: С 120 миллиардами параметров модель обладает огромным интеллектуальным потенциалом, позволяющим ей улавливать тончайшие нюансы контекста и строить длинные, логически безупречные цепочки выводов.
  • Оптимизация для Roleplay: Goliath 120B признана одной из лучших моделей для сложного ролевого взаимодействия, создания реалистичных персонажей и ведения длительных интерактивных историй.

Производительность и бенчмарки

Goliath 120B демонстрирует стабильно высокие результаты в тестах на общие знания и творческое письмо, становясь эталоном для моделей на базе мерджа.

БенчмаркРезультатОписание
Arena Elo1417Высокий профессиональный уровень
MMLU86.4%Глубокие общие знания и эрудиция
HumanEval82.9%Хорошее качество генерации программного кода
GPQA63.8%Научные вопросы PhD-уровня
MATH78.6%Хорошие способности в математике и логике
SWE_bench46.0%Решение инженерных задач

Ценообразование и доступность

Модель доступна через API популярных агрегаторов (например, OpenRouter) по цене $3.75 за 1M входных токенов и $7.50 за 1M выходных токенов. Это премиальное решение для тех, кто ищет бескомпромиссное качество текста и глубину «личности» ИИ для специфических творческих и аналитических задач.

Идеальные сценарии применения (Use Cases)

  • Глубокий Roleplay и сторителлинг: Создание максимально реалистичных ИИ-персонажей и проведение эпических текстовых приключений.
  • Художественное письмо и редактура: Помощь авторам в написании книг, сценариев и создании уникальных стилей изложения.
  • Сложный гуманитарный анализ: Глубокая проработка философских, психологических и социальных тем с высокой степенью детализации.

Плюсы и минусы

Плюсы:

  • Исключительная «человечность» и литературное качество текста.
  • Идеальный баланс между логикой и творчеством.
  • Огромная база знаний (120B параметров).
  • Проверенная временем стабильность и репутация в сообществе.

Минусы:

  • Высокая стоимость API по сравнению с современными MoE-флагманами.
  • Ограниченное контекстное окно (6K) в классической реализации.
  • Требует огромных вычислительных мощностей для локального запуска.

Стоимость API

$3.75 / $7.50 за 1M токенов

Профиль модели

MMLU86.4%Code82.9%Math78.6%GPQA63.8%SWE46%

Бенчмарки

Arena Elo (LMSYS)1417
MMLU (Общие знания)86.4%
HumanEval (Кодинг)82.9%
MATH (Математика)78.6%
GPQA (Экспертные знания)63.8%
SWE-bench (Разработка)46%

Другие модели семейства Other