登顶国产模型第一！阿里千问Qwen3.7-Max发布，可自主完成35小时硬核任务_业界资讯

登顶国产模型第一！阿里千问Qwen3.7-Max发布，可自主完成35小时硬核任务

2026-05-20 14:32 出处/作者：PConline原创整合编辑：科仔播报

【太平洋科技快讯】在2026阿里云峰会上，阿里巴巴正式推出千问大模型最新旗舰版本Qwen3.7-Max，凭借全面提升的智能体能力与推理性能，在Arena全球大模型盲测总榜中位列国产模型第一，综合水平接近GPT、Claude、Gemini国际顶尖模型，成为近三个月内千问系列的第三次重大迭代。

作为面向智能体(Agent)场景深度优化的大模型，Qwen3.7-Max在多项权威测评中实现突破。编程领域，该模型在SWE-Pro、SWE-Multilingual等智能体测评中领跑，Terminal Bench 2.0-Terminus得分达69.7，超越 DeepSeek-v4-pro-Max、Claude-Opus4.6等国际主流模型。通用智能体能力方面，在MCP-Atlas、MCP-Mark、Skillbench等贴近真实场景的测试中，Qwen3.7-Max表现优于GLM5.1、Kimi-K2.6，刷新国产模型最佳成绩。

推理与通用能力同样亮眼。在GPQA Diamond、HLE、HMMT 2026 Feb等高难度推理测评中，Qwen3.7-Max超越 Claude-Opus4.6 及所有国产模型；指令遵循测试IFBench斩获79.1分，多语言测评WMT24++、MAXIFE均保持领先。

最具标志性的是，Qwen3.7-Max完成了35小时全自主硬件优化任务。在无文档、无参考代码、无性能数据的全新平头哥真武M890芯片平台上，模型从零独立完成内核编写、编译、性能分析与迭代优化，全程执行432次内核评估、1158次工具调用，最终实现较官方参考实现10倍性能提升，并自主发起关键架构重构，展现出接近人类工程师的长期自主工作能力。

此外，该模型具备优秀的跨框架泛化能力，支持多智能体协同，在办公自动化场景SpreadSheetBench-v1 中取得87分的顶尖成绩。阿里云透露，Qwen3.7-Max API即将登陆百炼平台，后续还将推出Qwen3.7-Plus等版本，全面覆盖编程、视觉、办公等全场景智能体需求。

登顶国产模型第一！阿里千问Qwen3.7-Max发布，可自主完成35小时硬核任务

华为畅享90 Pro Max

HUAWEI Mate 80

苹果iPhone17

苹果iPhone17 Pro

iQOO Z11 Turbo

vivo Y600 Pro

荣耀500 Pro

一加Ace 6至尊版

荣耀X70

REDMI Turbo 5 Max