20 C
Sevastopol
22 мая, 2026
СЕВОБОРОНА
Технологии

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

Главный кейс из релиза: модель 35 часов работала полностью автономно, сделала 1158+ вызовов инструментов и самостоятельно оптимизировала низкоуровневое CUDA-ядро для работы с длинным контекстом на железе, на котором никогда не обучалась. Результат 10x прирост скорости инференса.

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

Контекстное окно 1M токенов, только текст (мультимодальности в этом релизе нет). По бенчмаркам: SWE-bench Pro — 60.6% (выше DeepSeek V4-Pro, но ниже Claude Opus 4.7 с 64.3%).

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

Интересно, что модель специально тестировали на трёх разных харнессах (OpenClaw, Claude Code и Hermes). Разброс результатов — в пределах ~6 пунктов.

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

Доступна через Qwen Studio (chat.qwen.ai) и Alibaba Cloud Model Studio (API). Веса Max-версии не открывают. Plus-версия серии Qwen3.7 уйдёт в open-source.

Русскоязычное сообщество про AI в разработке

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Источник