К списку моделей

Qwen3.5-27B

4.1

От Qwen

Open Source
CTX262K
Релиз: 2026-02-25
StandardGeneralTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

The Qwen3.5 27B native vision-language Dense model incorporates a linear attention mechanism, delivering fast response times while balancing inference speed and performance. Its overall capabilities are comparable to those of...

Подробный обзор модели

Qwen3.5-27B — это передовая плотная (dense) мультимодальная foundation-модель от Alibaba Cloud, выпущенная в феврале 2026 года. Она представляет собой значительный архитектурный сдвиг в серии Qwen, переходя к гибридному дизайну, который сочетает высокую скорость генерации и глубокое нативное понимание визуального контента. Модель спроектирована как универсальный инструмент для разработчиков, предлагая производительность флагманского уровня в компактном форм-факторе.

Архитектура и технические инновации

В отличие от MoE-вариантов в семействе Qwen3.5, модель 27B является «плотной» — все 27 миллиардов параметров активируются для каждого токена, что обеспечивает исключительную точность и стабильность.

Ключевой особенностью является гибридный механизм внимания (Hybrid Attention):

  • Архитектура состоит из 64 слоев, разделенных на группы.
  • Каждая группа включает слои линейного внимания (Linear Attention / DeltaNet) для эффективной работы с длинным контекстом.
  • Дополнительные слои стандартного внимания (Gated Attention) сохраняют высокую точность логических рассуждений.

Нативное контекстное окно составляет 262 144 (262k) токена, с возможностью расширения до 1 010 000 токенов, что позволяет анализировать гигантские объемы данных без потери качества.

Мультимодальные возможности

Qwen3.5-27B — это нативно мультимодальная модель, обученная по методу Early Fusion. Это означает, что визуальная информация (изображения, видео) и текст обрабатываются в едином пространстве токенов с самого начала обучения.

  • Глубокое понимание документов: Модель великолепно справляется с анализом сложных PDF, графиков и диаграмм.
  • Визуальный кодинг: Способность взаимодействовать с графическими интерфейсами делает ее идеальной для создания агентов, управляющих компьютером или пишущих код на основе макетов.
  • Локализация объектов: Высокая точность в определении координат объектов на изображениях и видео.

Производительность и бенчмарки

Модель 27B демонстрирует результаты, превосходящие многие гораздо более крупные системы и проприетарные «мини-флагманы»:

  • MMLU-Pro: 86.1% — экспертный уровень знаний в широком спектре дисциплин.
  • GPQA Diamond: 85.5% — способность решать научные задачи уровня аспирантуры.
  • SWE-bench Verified: 72.4% – 75.0% — лидерство в классе по качеству написания и отладки реального кода.
  • Многоязычность: Поддержка 201 языка и диалекта, что делает ее одной из самых лингвистически развитых моделей в мире.

Цены и доступность

Qwen3.5-27B позиционируется как доступная «профессиональная» модель:

  • Входящие токены: ~$0.20 за 1 миллион токенов.
  • Исходящие токены: ~$1.56 за 1 миллион токенов.
  • Лицензия: Apache 2.0, что позволяет свободно использовать веса модели для коммерческих целей и локального развертывания.

Идеальные сценарии применения (Use Cases)

  • Автономные кодинг-агенты: Высокие показатели в SWE-bench делают ее идеальным движком для ИИ-разработчиков.
  • Корпоративный анализ данных: Обработка больших массивов технической документации, юридических контрактов и видеоархивов.
  • Глобальные приложения: Продукты, требующие глубокого понимания региональных культурных нюансов и редких языков.
  • Визуальные помощники: Приложения, анализирующие действия пользователя на экране для автоматизации рутинных задач.

Плюсы и минусы

Плюсы:

  • Уникальная гибридная архитектура с линейным вниманием для скорости и точности.
  • Нативная мультимодальность (текст, фото, видео) без сторонних энкодеров.
  • Поддержка рекордного количества языков (201+).
  • Полностью открытые веса (Apache 2.0).

Минусы:

  • Требует значительного объема видеопамяти для работы с максимальным контекстом (1M).
  • Плотная архитектура (27B) может быть медленнее MoE-аналогов при генерации на слабом оборудовании.

На чем запустили?

Опыт запуска Qwen3.5-27B на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.20 / $1.56 за 1M токенов

Профиль модели

MMLU84.6%Code79.8%Math72.8%GPQA59.6%SWE49.4%

Бенчмарки

Arena Elo (LMSYS)1395
MMLU (Общие знания)84.6%
HumanEval (Кодинг)79.8%
MATH (Математика)72.8%
GPQA (Экспертные знания)59.6%
SWE-bench (Разработка)49.4%

Другие модели семейства Qwen