К списку моделей

Virtuoso Large

4.7

От Arcee AI

Proprietary
CTX131K
Релиз: 2025-05-05
ProGeneralText
Официальный сайт

Краткое описание

Virtuoso‑Large is Arcee's top‑tier general‑purpose LLM at 72 B parameters, tuned to tackle cross‑domain reasoning, creative writing and enterprise QA. Unlike many 70 B peers, it retains the 128 k...

Подробный обзор модели

Virtuoso Large от Arcee AI — это мощная языковая модель корпоративного уровня, построенная на базе архитектуры Qwen 2.5 с параметрами 72B. Она была специально оптимизирована для решения сложных аналитических задач и глубокого рассуждения, вобрав в себя лучшие наработки в области дистилляции знаний и выравнивания предпочтений.

Архитектура и особенности

Модель Virtuoso Large использует проверенную архитектуру Qwen 2.5, но с существенными доработками от команды Arcee AI. Одной из ключевых технологий стала дистилляция из DeepSeek R1, что наделило модель способностью к сложным логическим цепочкам (Chain-of-Thought). При объеме в 72 миллиарда параметров она демонстрирует эффективность, сопоставимую с гораздо более крупными моделями. Контекстное окно составляет 131 072 токена (около 128k), что позволяет анализировать объемные документы, целые базы кода или длинные цепочки переписки без потери контекста.

Производительность и бенчмарки

В ходе тестирования Virtuoso Large показала впечатляющие результаты, особенно в области логики и кодинга. Благодаря оптимизированному процессу обучения, она уверенно конкурирует с лидерами рынка в своем весовом классе.

БенчмаркРезультат
Arena Elo1566
MMLU94.7%
HumanEval (Coding)94.4%
MATH89.4%
GPQA79.2%
SWE_bench57.4%

Такие цифры говорят о том, что модель не просто хорошо воспроизводит заученные данные, но и способна к решению нестандартных математических и инженерных задач.

Цены и доступность

Virtuoso Large предлагает отличное соотношение цены и качества. Стоимость входных токенов составляет $0.75 за 1 миллион, а выходных — $1.20 за 1 миллион. Это делает её значительно более доступной, чем проприетарные модели уровня GPT-4o, при сохранении высокой точности ответов. Модель доступна через API Arcee AI и других провайдеров, а также поддерживает возможность развертывания на собственной инфраструктуре (Open Weights).

Идеальные сценарии применения

Модель лучше всего проявляет себя в следующих областях:

  • Техническое писательство и документирование кода.
  • Сложный анализ данных и поиск скрытых закономерностей.
  • Корпоративные Q&A системы с глубоким пониманием контекста.
  • Креативный копирайтинг и генерация контента с заданным тоном голоса.
  • Интеграция в сложные AI-агенты благодаря поддержке вызова функций (Tool Use).

Плюсы и минусы

Плюсы:

  • Высокая производительность в задачах на логику и рассуждение благодаря дистилляции R1.
  • Оптимальный баланс между скоростью работы и качеством ответов.
  • Большое контекстное окно (128k) для работы с длинными текстами.
  • Доступная цена по сравнению с топовыми конкурентами.

Минусы:

  • Требует значительных вычислительных ресурсов для локального развертывания.
  • В некоторых узкоспециализированных областях может уступать моделям с параметрами 400B+.

Стоимость API

$0.75 / $1.20 за 1M токенов

Профиль модели

MMLU94.7%Code94.4%Math89.4%GPQA79.2%SWE57.4%

Бенчмарки

Arena Elo (LMSYS)1566
MMLU (Общие знания)94.7%
HumanEval (Кодинг)94.4%
MATH (Математика)89.4%
GPQA (Экспертные знания)79.2%
SWE-bench (Разработка)57.4%

Другие модели семейства Other