От Qwen
Qwen3-VL-30B-A3B-Thinking is a multimodal model that unifies strong text generation with visual understanding for images and videos. Its Thinking variant enhances reasoning in STEM, math, and complex tasks. It excels...
Qwen3 VL 30B A3B Thinking — это специализированная мультимодальная модель из новейшей серии Qwen3, объединяющая в себе мощь текстового интеллекта и передовые способности визуального анализа с инновационным режимом «активного мышления» (Thinking). При общем объеме в 30 миллиардов параметров, модель использует разреженную архитектуру Mixture-of-Experts (MoE), активируя всего 3 миллиарда на каждом шаге, что обеспечивает феноменальную точность рассуждений при сохранении высокой скорости работы.
Модель была специально дообучена для задач, требующих пошагового анализа как текстовой, так и визуальной информации.
Qwen3 VL 30B A3B Thinking показывает выдающиеся результаты в задачах на рассуждение и программирование, становясь одним из лидеров в своём весовом классе.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MATH | 92.2% | Исключительная точность в математических рассуждениях (премиум) |
| Arena Elo | 1417 | Высокий уровень для мультимодальных моделей |
| MMLU | 86.4% | Глубокие общие знания и эрудиция |
| HumanEval | 82.2% | Уверенное владение программированием |
| GPQA | 68.4% | Научные тесты PhD-уровня |
| SWE_bench | 51.2% | Решение инженерных задач |
Модель доступна через API по крайне привлекательной цене: $0.13 за 1M входных токенов и $1.56 за 1M выходных токенов. Это делает её идеальным инструментом для профессиональных разработчиков, внедряющих функции глубокого визуального анализа и рассуждения в свои продукты.
Плюсы:
Минусы:
Опыт запуска Qwen3 VL 30B A3B Thinking на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.13 / $1.56 за 1M токенов