К списку моделей

Qwen3.5 397B A17B

4.4

От Qwen

Open Source
CTX262K
Релиз: 2026-02-16
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. It delivers...

Подробный обзор модели

Обзор Qwen3.5 397B A17B: Гигант с гибридным разумом (2026)

Qwen3.5 397B A17B — это монументальная мультимодальная модель с открытыми весами от команды Qwen, представленная в феврале 2026 года. Она построена на уникальной гибридной архитектуре, сочетающей механизмы линейного внимания (linear attention) с разреженной структурой Mixture-of-Experts (MoE). Это позволяет модели обладать колоссальной базой знаний при сохранении высокой эффективности инференса.

Технологические инновации Qwen3.5

1. Гибридная архитектура внимания

Использование линейного внимания в сочетании с MoE (активация 17 млрд параметров из 397 млрд) — это настоящий прорыв. Такая структура обеспечивает практически неограниченную масштабируемость при работе с длинным контекстом, значительно снижая вычислительные затраты на генерацию каждого токена по сравнению с традиционными трансформерами.

2. Нативное зрение и понимание языка

Модель изначально обучалась как мультимодальная система. Она демонстрирует глубокое понимание визуальных сцен, текста на изображениях и сложных диаграмм, бесшовно интегрируя визуальную информацию в общую логику рассуждения.

3. Расширенный контекст 262K

Поддержка контекстного окна в 262 000 токенов позволяет Qwen3.5 анализировать огромные массивы данных, включая целые библиотеки документов или длинные видеозаписи, находя скрытые связи и формируя комплексные выводы флагманского уровня.

Бенчмарки (Состояние на май 2026)

БенчмаркРезультат Qwen3.5 397BКатегория
Arena Elo1454Топ-уровень открытых гигантов
MMLU89.5%Общие знания
HumanEval88.6%Написание кода
MATH96.7%Математика (премиум уровень)
GPQA69.9%Научные вопросы
SWE_bench58.1%Решение инженерных задач

Сценарии использования

  • Глобальные аналитические системы: Обработка терабайтов информации с выявлением сложных рыночных и научных трендов.
  • Корпоративные базы знаний: Создание централизованных ИИ-ассистентов для управления всей информацией крупной компании.
  • Сложная разработка ПО: Использование в качестве «главного архитектора» для проектирования масштабных программных систем.

Доступность и цена

Несмотря на свои гигантские размеры, благодаря MoE-архитектуре, модель доступна через API по весьма умеренной цене: $0.39 за 1M входных токенов. Это делает Qwen3.5 397B одним из самых мощных и доступных инструментов для решения задач «Frontier»-уровня.


Статья подготовлена для Gruzdevv.ru. Все данные актуальны на май 2026 года.

На чем запустили?

Опыт запуска Qwen3.5 397B A17B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.39 / $2.34 за 1M токенов

Профиль модели

MMLU89.5%Code88.6%Math96.7%GPQA69.9%SWE58.1%

Бенчмарки

Arena Elo (LMSYS)1454
MMLU (Общие знания)89.5%
HumanEval (Кодинг)88.6%
MATH (Математика)96.7%
GPQA (Экспертные знания)69.9%
SWE-bench (Разработка)58.1%

Другие модели семейства Qwen