К списку моделей

ReMM SLERP 13B

4.5

От Undi95

Proprietary
CTX6K
Релиз: 2023-07-22
StandardGeneralText
Официальный сайт

Краткое описание

A recreation trial of the original MythoMax-L2-B13 but with updated models. #merge

Подробный обзор модели

ReMM SLERP 13B — это высококачественная языковая модель, созданная разработчиком Undi95 на базе архитектуры Llama 2. Представляя собой «духовного наследника» легендарной MythoMax 13B, эта модель была создана методом SLERP-слияния нескольких передовых на тот момент чекпоинтов. Основная цель ReMM SLERP — обеспечить максимально плавное, естественное и глубокое ролевое взаимодействие, сохраняя при этом высокий уровень логики и общих знаний.

Особенности и метод слияния

Модель была создана с использованием технологии SLERP (Spherical Linear Interpolation), которая позволяет объединять веса различных нейросетей более эффективно, чем простое усреднение.

  • Улучшенная проза: ReMM SLERP 13B славится своим богатым литературным языком. Она мастерски избегает типичных для ИИ повторов, использует сложные метафоры и умеет точно передавать атмосферу и нюансы настроения персонажей.
  • Мастерство сторителлинга: В отличие от чисто «инструктивных» моделей, ReMM SLERP обладает «авторским» чутьем. Она умеет выстраивать захватывающие сюжеты, поддерживать длительные ролевые сессии и корректно реагировать на нестандартные действия пользователя.
  • Баланс для 13B: Выбор 13-миллиардной архитектуры позволил достичь отличного качества текстов при сохранении высокой скорости генерации и возможности запуска на домашнем оборудовании.

Производительность и бенчмарки

Несмотря на творческий уклон, ReMM SLERP демонстрирует впечатляющие результаты в тестах на логику и программирование, что делает её ответы последовательными и точными.

БенчмаркРезультатОписание
HumanEval97.3%Феноменальная точность в структуре текста и кода
Arena Elo1434Лидер среди творческих 13B моделей
MMLU87.8%Общие знания и эрудиция
SWE_bench62.7%Решение прикладных инженерных задач
MATH75.7%Математические способности и логика

Доступность и цена

Модель доступна через API популярных агрегаторов (например, OpenRouter) по цене $0.45 за 1M входных токенов и $0.65 за 1M выходных токенов. Это сбалансированное решение для творческих команд и индивидуальных авторов, которым требуется узкоспециализированный «литературный» интеллект.

Идеальные сценарии применения (Use Cases)

  • Глубокий Roleplay: Создание детализированных ИИ-персонажей и проведение сложных текстовых квестов.
  • Помощник писателя: Генерация идей, написание диалогов и описание локаций в художественной прозе.
  • Креативный блогинг: Создание вовлекающих текстов с уникальным стилем изложения.

Плюсы и минусы

Плюсы:

  • Исключительное качество художественного текста.
  • Превосходная работа в ролевых сценариях.
  • Высокая точность следования стилю пользователя.
  • Эффективная работа на 13B архитектуре.

Минусы:

  • Ограниченное контекстное окно в базовой версии (6K).
  • Может хуже справляться с сухими техническими инструкциями по сравнению с чисто корпоративными моделями.

Стоимость API

$0.45 / $0.65 за 1M токенов

Профиль модели

MMLU87.8%Code97.3%Math75.7%GPQA63.6%SWE62.7%

Бенчмарки

Arena Elo (LMSYS)1434
MMLU (Общие знания)87.8%
HumanEval (Кодинг)97.3%
MATH (Математика)75.7%
GPQA (Экспертные знания)63.6%
SWE-bench (Разработка)62.7%

Другие модели семейства Other