От Qwen
Qwen3 VL 8B Instruct — мультимодальная модель Alibaba для анализа видео и GUI. Использует технологию Interleaved-MRoPE для точного пространственно-временного рассуждения. Контекст 128K, цена $0.08/$0.50 за 1 млн токенов.
Опыт запуска Qwen3 VL 8B Instruct на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.08 / $0.50 за 1M токенов