От Qwen
The Qwen3.5 27B native vision-language Dense model incorporates a linear attention mechanism, delivering fast response times while balancing inference speed and performance. Its overall capabilities are comparable to those of...
Qwen3.5-27B — это передовая плотная (dense) мультимодальная foundation-модель от Alibaba Cloud, выпущенная в феврале 2026 года. Она представляет собой значительный архитектурный сдвиг в серии Qwen, переходя к гибридному дизайну, который сочетает высокую скорость генерации и глубокое нативное понимание визуального контента. Модель спроектирована как универсальный инструмент для разработчиков, предлагая производительность флагманского уровня в компактном форм-факторе.
В отличие от MoE-вариантов в семействе Qwen3.5, модель 27B является «плотной» — все 27 миллиардов параметров активируются для каждого токена, что обеспечивает исключительную точность и стабильность.
Ключевой особенностью является гибридный механизм внимания (Hybrid Attention):
Нативное контекстное окно составляет 262 144 (262k) токена, с возможностью расширения до 1 010 000 токенов, что позволяет анализировать гигантские объемы данных без потери качества.
Qwen3.5-27B — это нативно мультимодальная модель, обученная по методу Early Fusion. Это означает, что визуальная информация (изображения, видео) и текст обрабатываются в едином пространстве токенов с самого начала обучения.
Модель 27B демонстрирует результаты, превосходящие многие гораздо более крупные системы и проприетарные «мини-флагманы»:
Qwen3.5-27B позиционируется как доступная «профессиональная» модель:
Плюсы:
Минусы:
Опыт запуска Qwen3.5-27B на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.20 / $1.56 за 1M токенов