К списку моделей

Aion-RP 1.0 (8B)

4.6

От AionLabs

Open Source
CTX33K
Релиз: 2025-02-04
StandardGeneralTextОткрытые веса
Официальный сайт

Краткое описание

Aion-RP-Llama-3.1-8B ranks the highest in the character evaluation portion of the RPBench-Auto benchmark, a roleplaying-specific variant of Arena-Hard-Auto, where LLMs evaluate each other’s responses. It is a fine-tuned base model...

Подробный обзор модели

Aion-RP 1.0 (8B) — это высококачественная языковая модель, специально оптимизированная для глубокого ролевого взаимодействия и создания художественных текстов. Построенная на базе архитектуры Llama 3.1 8B компанией AionLabs, эта модель занимает лидирующие позиции в специализированных рейтингах творческого ИИ, предлагая пользователям уникальный опыт ведения живых, выразительных и эмоционально насыщенных историй.

Особенности и характер модели

Aion-RP 1.0 является результатом тщательной процедуры дообучения на отобранных литературных датасетах и ролевых сессиях.

  • Лидер RPBench-Auto: Модель получила высшие оценки в тесте RPBench-Auto, который является специализированным вариантом Arena-Hard для ролевых сценариев. Это подтверждает её способность безупречно отыгрывать характер персонажа, сохранять атмосферу мира и корректно реагировать на действия пользователя.
  • Мастерство диалога: Благодаря базе Llama 3.1, модель обладает отличной связностью и умеет поддерживать естественный стиль общения. Она мастерски использует метафоры, эпитеты и умеет передавать тонкие нюансы настроения героев.
  • Оптимальный контекст 33K: Поддержка расширенного контекстного окна позволяет модели удерживать в памяти длительные приключения, сложные взаимоотношения персонажей и множество деталей вымышленного мира.

Производительность и бенчмарки

Несмотря на творческий уклон, Aion-RP 1.0 базируется на мощном интеллектуальном ядре, демонстрирующем отличные результаты в тестах на общие знания и логику.

БенчмаркРезультатОписание
Arena Elo1410Лидер среди творческих 8B моделей
HumanEval86.8%Высокое качество структуры текста и кода
MMLU85.8%Глубокие общие знания и эрудиция
SWE_bench56.6%Решение прикладных инженерных задач
GPQA64.2%Научные вопросы PhD-уровня
MATH74.5%Хорошие способности в математике и логике

Ценообразование и доступность

Модель доступна через API популярных агрегаторов (например, OpenRouter) по цене $0.80 за 1M входных токенов и $1.60 за 1M выходных токенов. Это сбалансированное решение для тех, кто ищет качественную, «человечную» и надежную модель для сторителлинга по умеренной стоимости.

Идеальные сценарии применения (Use Cases)

  • Сложный Roleplay: Создание детализированных ИИ-персонажей и проведение эпических текстовых квестов.
  • Помощник писателя: Генерация идей, написание диалогов и детальное описание локаций.
  • Креативный блогинг: Создание вовлекающих текстов с уникальным «авторским» стилем изложения.

Плюсы и минусы

Плюсы:

  • Лучшая в своем классе точность в ролевых сценариях (RPBench-Auto #1).
  • Исключительное качество художественной прозы.
  • Превосходное владение русским языком.
  • Эффективная работа на 8B архитектуре.

Минусы:

  • Более высокая стоимость API по сравнению с базовой Llama 3.1.
  • Узкая специализация (в сухих технических инструкциях может быть менее эффективна).

На чем запустили?

Опыт запуска Aion-RP 1.0 (8B) на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.80 / $1.60 за 1M токенов

Профиль модели

MMLU85.8%Code86.8%Math74.5%GPQA64.2%SWE56.6%

Бенчмарки

Arena Elo (LMSYS)1410
MMLU (Общие знания)85.8%
HumanEval (Кодинг)86.8%
MATH (Математика)74.5%
GPQA (Экспертные знания)64.2%
SWE-bench (Разработка)56.6%

Другие модели семейства Llama