От Qwen
Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences. It integrates enhanced multimodal alignment and...
Qwen3 VL 8B Thinking — это специализированная модификация мультимодальной модели Qwen3 VL 8B, оптимизированная для задач, требующих глубокого визуального и текстового рассуждения. Представленная в октябре 2025 года, она объединяет в себе компактность 8-миллиардной архитектуры с передовыми способностями к пошаговому анализу сложных изображений, документов и видеопоследовательностей.
В отличие от стандартных VL-моделей, версия "Thinking" обучена «задумываться» над визуальным контекстом. Она не просто описывает увиденное, а строит цепочки рассуждений, выявляя скрытые зависимости и логические противоречия в сложных сценах или многостраничных документах.
Модель демонстрирует выдающиеся результаты в анализе графиков, схем, чертежей и сложного рукописного текста. Она идеально подходит для задач автоматизированного контроля качества и верификации данных, где важна каждая деталь.
Qwen3 VL Thinking поддерживает контекстное окно до 128 000+ токенов, что позволяет ей анализировать не только отдельные кадры, но и длинные видео-фрагменты или целые пакеты отсканированных документов, сохраняя высокую точность выводов.
| Бенчмарк | Результат Qwen3 VL 8B | Категория |
|---|---|---|
| Arena Elo | 1450 | Лидер среди малых VL-моделей |
| MMLU | 89.2% | Общие знания |
| HumanEval | 98.3% | Качество кода (премиум) |
| MATH | 96.0% | Математические рассуждения |
| GPQA | 67.9% | Научные вопросы |
| SWE_bench | 59.0% | Решение инженерных задач |
Qwen3 VL 8B Thinking доступна по цене $0.12 за 1M входных токенов. Это делает её одним из самых мощных и при этом доступных инструментов для внедрения продвинутого компьютерного зрения в профессиональные рабочие процессы.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
Опыт запуска Qwen3 VL 8B Thinking на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.12 / $1.36 за 1M токенов