К списку моделей

Qwen3 235B A22B Thinking 2507

4.8

От Qwen

Open Source
CTX131K
Релиз: 2025-07-25
StandardReasoningTextОткрытые весаFrontier EfficiencyЛокальная
Официальный сайт

Краткое описание

Qwen3-235B-A22B-Thinking-2507 is a high-performance, open-weight Mixture-of-Experts (MoE) language model optimized for complex reasoning tasks. It activates 22B of its 235B parameters per forward pass and natively supports up to 262,144...

Подробный обзор модели

Qwen3 235B A22B Thinking 2507 — это обновленная флагманская модель из серии Qwen3, специально оптимизированная для решения сложнейших задач, требующих глубокого пошагового рассуждения и высокой точности логического вывода. С архитектурой Mixture-of-Experts (MoE) на 235 миллиардов параметров, модель активирует лишь 22 миллиарда на каждом шаге, предлагая уникальное сочетание интеллектуальной мощи «Frontier»-уровня и рекордной эффективности инференса.

Особенности и механизмы рассуждения

Модель была разработана для профессионалов в области STEM, программирования и аналитики.

  • Thinking Mode: Версия Thinking 2507 обучена строить скрытые внутренние цепочки мыслей перед выдачей ответа. Это позволяет модели проводить самопроверку логики, находить ошибки в постановке задачи и предлагать более выверенные и глубокие решения по сравнению с базовыми версиями.
  • Масштабируемая MoE: Активация всего 22B параметров позволяет Qwen3 Thinking работать со скоростью систем среднего веса, предлагая при этом эрудицию и логику гигантских 200B+ моделей.
  • Широкий контекст 262K: Поддержка гигантского контекстного окна позволяет модели анализировать целые библиотеки документов, многочасовые транскрибации и сложнейшие технические спецификации, сохраняя безупречную логику на протяжении всей сессии.

Производительность и бенчмарки

Qwen3 235B A22B Thinking уверенно занимает топовые позиции среди «рассуждающих» моделей, соревнуясь с лучшими закрытыми аналогами.

БенчмаркРезультатОписание
HumanEval88.6%Исключительная точность в программировании
MATH88.2%Высокие показатели в математических рассуждениях
Arena Elo1412Высокий флагманский уровень
MMLU86.0%Глубокие общие знания и эрудиция
GPQA64.0%Научные вопросы PhD-уровня
SWE_bench56.6%Успешное решение реальных задач в коде

Ценообразование и доступность

Модель доступна через API по крайне привлекательной цене: всего $0.15 за 1M входных токенов и $1.50 за 1M выходных токенов. Это делает Qwen3 Thinking 2507 одним из самых выгодных решений на рынке для систем, требующих глубокого интеллектуального анализа за минимальную стоимость.

Идеальные сценарии применения (Use Cases)

  • Глубокие научные исследования: Помощь в решении сложных уравнений, анализе данных и верификации научных теорий.
  • Профессиональный кодинг и аудит: Проектирование архитектуры систем и поиск трудноуловимых логических багов в коде.
  • Аналитические системы принятия решений: Использование в качестве ядра систем, требующих детального обоснования каждого шага.

Плюсы и минусы

Плюсы:

  • Рекордная точность в задачах на логику и математику (режим Thinking).
  • Огромное контекстное окно (262K).
  • Превосходное владение русским языком и знание локального контекста.
  • Высокая эффективность благодаря MoE-архитектуре.

Минусы:

  • Более высокая задержка ответа по сравнению с базовыми версиями из-за фазы «мышления».
  • Требует четко структурированных промптов для раскрытия полного потенциала Thinking-режима.

На чем запустили?

Опыт запуска Qwen3 235B A22B Thinking 2507 на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.15 / $1.50 за 1M токенов

Профиль модели

MMLU86%Code88.6%Math88.2%GPQA64%SWE56.6%

Бенчмарки

Arena Elo (LMSYS)1412
MMLU (Общие знания)86%
HumanEval (Кодинг)88.6%
MATH (Математика)88.2%
GPQA (Экспертные знания)64%
SWE-bench (Разработка)56.6%

Другие модели семейства Qwen