От Qwen
Qwen3-235B-A22B-Thinking-2507 is a high-performance, open-weight Mixture-of-Experts (MoE) language model optimized for complex reasoning tasks. It activates 22B of its 235B parameters per forward pass and natively supports up to 262,144...
Qwen3 235B A22B Thinking 2507 — это обновленная флагманская модель из серии Qwen3, специально оптимизированная для решения сложнейших задач, требующих глубокого пошагового рассуждения и высокой точности логического вывода. С архитектурой Mixture-of-Experts (MoE) на 235 миллиардов параметров, модель активирует лишь 22 миллиарда на каждом шаге, предлагая уникальное сочетание интеллектуальной мощи «Frontier»-уровня и рекордной эффективности инференса.
Модель была разработана для профессионалов в области STEM, программирования и аналитики.
Qwen3 235B A22B Thinking уверенно занимает топовые позиции среди «рассуждающих» моделей, соревнуясь с лучшими закрытыми аналогами.
| Бенчмарк | Результат | Описание |
|---|---|---|
| HumanEval | 88.6% | Исключительная точность в программировании |
| MATH | 88.2% | Высокие показатели в математических рассуждениях |
| Arena Elo | 1412 | Высокий флагманский уровень |
| MMLU | 86.0% | Глубокие общие знания и эрудиция |
| GPQA | 64.0% | Научные вопросы PhD-уровня |
| SWE_bench | 56.6% | Успешное решение реальных задач в коде |
Модель доступна через API по крайне привлекательной цене: всего $0.15 за 1M входных токенов и $1.50 за 1M выходных токенов. Это делает Qwen3 Thinking 2507 одним из самых выгодных решений на рынке для систем, требующих глубокого интеллектуального анализа за минимальную стоимость.
Плюсы:
Минусы:
Опыт запуска Qwen3 235B A22B Thinking 2507 на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.15 / $1.50 за 1M токенов