К списку моделей

Qwen3 VL 30B A3B Thinking

4.2

От Qwen

Open Source
CTX131K
Релиз: 2025-10-06
StandardReasoningMultimodalОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3-VL-30B-A3B-Thinking is a multimodal model that unifies strong text generation with visual understanding for images and videos. Its Thinking variant enhances reasoning in STEM, math, and complex tasks. It excels...

Подробный обзор модели

Qwen3 VL 30B A3B Thinking — это специализированная мультимодальная модель из новейшей серии Qwen3, объединяющая в себе мощь текстового интеллекта и передовые способности визуального анализа с инновационным режимом «активного мышления» (Thinking). При общем объеме в 30 миллиардов параметров, модель использует разреженную архитектуру Mixture-of-Experts (MoE), активируя всего 3 миллиарда на каждом шаге, что обеспечивает феноменальную точность рассуждений при сохранении высокой скорости работы.

Особенности и механизмы рассуждения

Модель была специально дообучена для задач, требующих пошагового анализа как текстовой, так и визуальной информации.

  • Thinking Mode: В режиме «мышления» модель способна строить внутренние цепочки рассуждений перед выдачей ответа. Это позволяет ей находить скрытые ошибки в логике, проводить глубокую верификацию данных и решать сложнейшие задачи в STEM-дисциплинах.
  • Интеллектуальное зрение: Версия Thinking демонстрирует превосходство в анализе сложных визуальных сцен, чтении мелкого текста на изображениях, распознавании технических чертежей и анализе видео-фрагментов.
  • Широкий контекст 131K: Поддержка контекстного окна до 131 072 токенов позволяет модели анализировать не только отдельные кадры, но и целые пакеты документов или длительные видеоархивы в рамках одного запроса.

Производительность и бенчмарки

Qwen3 VL 30B A3B Thinking показывает выдающиеся результаты в задачах на рассуждение и программирование, становясь одним из лидеров в своём весовом классе.

БенчмаркРезультатОписание
MATH92.2%Исключительная точность в математических рассуждениях (премиум)
Arena Elo1417Высокий уровень для мультимодальных моделей
MMLU86.4%Глубокие общие знания и эрудиция
HumanEval82.2%Уверенное владение программированием
GPQA68.4%Научные тесты PhD-уровня
SWE_bench51.2%Решение инженерных задач

Ценообразование и доступность

Модель доступна через API по крайне привлекательной цене: $0.13 за 1M входных токенов и $1.56 за 1M выходных токенов. Это делает её идеальным инструментом для профессиональных разработчиков, внедряющих функции глубокого визуального анализа и рассуждения в свои продукты.

Идеальные сценарии применения (Use Cases)

  • Глубокий аудит документов: Парсинг сложнейших PDF-файлов, чертежей и отчетов с выявлением логических противоречий.
  • Интеллектуальная видеоаналитика: Автоматическое описание событий и поиск по видеоархивам с глубоким временным анализом.
  • Помощник инженера: Визуальная проверка архитектурных схем и автоматическое создание документации на основе визуальных прототипов.

Плюсы и минусы

Плюсы:

  • Феноменальная точность в математике и логике (режим Thinking).
  • Нативная поддержка видео и изображений.
  • Эффективная MoE-архитектура (3B активных параметров).
  • Широкое контекстное окно (131K).

Минусы:

  • Требует четкого указания режима работы для раскрытия потенциала Thinking.
  • Проприетарная модель (доступ только через API Qwen или OpenRouter).

На чем запустили?

Опыт запуска Qwen3 VL 30B A3B Thinking на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.13 / $1.56 за 1M токенов

Профиль модели

MMLU86.4%Code82.2%Math92.2%GPQA68.4%SWE51.2%

Бенчмарки

Arena Elo (LMSYS)1417
MMLU (Общие знания)86.4%
HumanEval (Кодинг)82.2%
MATH (Математика)92.2%
GPQA (Экспертные знания)68.4%
SWE-bench (Разработка)51.2%

Другие модели семейства Qwen