От Qwen
Qwen3-VL-235B-A22B Instruct is an open-weight multimodal model that unifies strong text generation with visual understanding across images and video. The Instruct model targets general vision-language use (VQA, document parsing, chart/table...
Qwen3 VL 235B A22B Instruct — это передовая мультимодальная модель с открытыми весами, объединяющая в себе мощь глубокого текстового интеллекта и продвинутые способности визуального восприятия. С архитектурой, использующей активацию 22 миллиардов параметров из общих 235, модель предлагает исключительную производительность в анализе изображений и видео при сохранении высокой скорости работы.
В отличие от многих моделей, использующих внешние модули «зрения», Qwen3 VL изначально обучена работе с мультимодальными данными. Она одинаково эффективно справляется с описанием статичных картинок, парсингом сложных документов и анализом динамических сцен на видео.
Модель была специально оптимизирована для извлечения информации из визуально представленных данных. Qwen3 VL идеально подходит для автоматизации обработки счетов, чеков, графиков и технических чертежей, преобразуя визуальную информацию в структурированный текст.
Поддержка огромного окна контекста позволяет модели анализировать не просто отдельные кадры, а длинные видеозаписи или целые пакеты документов в рамках одного запроса, сохраняя связность и глубокое понимание всех деталей.
| Бенчмарк | Результат Qwen3 VL | Категория |
|---|---|---|
| Arena Elo | 1456 | Лидер среди мультимодальных открытых весов |
| MMLU | 89.7% | Общие знания |
| HumanEval | 94.0% | Генерация кода (премиум уровень) |
| MATH | 82.8% | Математические вычисления |
| GPQA | 71.7% | Научные тесты |
| SWE_bench | 55.9% | Решение инженерных задач |
Qwen3 VL 235B A22B Instruct доступна через API по крайне выгодной цене: $0.20 за 1M входных токенов. Это делает её одним из самых доступных и мощных инструментов для бизнеса, внедряющего технологии компьютерного зрения и глубокого анализа данных.
Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.
Опыт запуска Qwen3 VL 235B A22B Instruct на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.20 / $0.88 за 1M токенов