От TNG
DeepSeek-TNG R1T2 Chimera — модель на 671B параметров, объединяющая три чекпоинта DeepSeek для баланса логики и скорости. Демонстрирует 98.3% в MATH 500 и работает на 20% быстрее оригинальной R1.
Опыт запуска DeepSeek R1T2 Chimera на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.30 / $1.10 за 1M токенов