首页 > 业界资讯 > 正文

登顶国产模型第一!阿里千问Qwen3.7-Max发布,可自主完成35小时硬核任务

【太平洋科技快讯】在2026阿里云峰会上,阿里巴巴正式推出千问大模型最新旗舰版本Qwen3.7-Max,凭借全面提升的智能体能力与推理性能,在Arena全球大模型盲测总榜中位列国产模型第一,综合水平接近GPT、Claude、Gemini国际顶尖模型,成为近三个月内千问系列的第三次重大迭代。

作为面向智能体(Agent)场景深度优化的大模型,Qwen3.7-Max在多项权威测评中实现突破。编程领域,该模型在SWE-Pro、SWE-Multilingual等智能体测评中领跑,Terminal Bench 2.0-Terminus得分达69.7,超越 DeepSeek-v4-pro-Max、Claude-Opus4.6等国际主流模型。通用智能体能力方面,在MCP-Atlas、MCP-Mark、Skillbench等贴近真实场景的测试中,Qwen3.7-Max表现优于GLM5.1、Kimi-K2.6,刷新国产模型最佳成绩。

推理与通用能力同样亮眼。在GPQA Diamond、HLE、HMMT 2026 Feb等高难度推理测评中,Qwen3.7-Max超越 Claude-Opus4.6 及所有国产模型;指令遵循测试IFBench斩获79.1分,多语言测评WMT24++、MAXIFE均保持领先。

最具标志性的是,Qwen3.7-Max完成了35小时全自主硬件优化任务。在无文档、无参考代码、无性能数据的全新平头哥真武M890芯片平台上,模型从零独立完成内核编写、编译、性能分析与迭代优化,全程执行432次内核评估、1158次工具调用,最终实现较官方参考实现10倍性能提升,并自主发起关键架构重构,展现出接近人类工程师的长期自主工作能力。

此外,该模型具备优秀的跨框架泛化能力,支持多智能体协同,在办公自动化场景SpreadSheetBench-v1 中取得87分的顶尖成绩。阿里云透露,Qwen3.7-Max API即将登陆百炼平台,后续还将推出Qwen3.7-Plus等版本,全面覆盖编程、视觉、办公等全场景智能体需求。

网友评论

热门IT产品
  1. ¥1699
    华为畅享90 Pro Max
    ·
  2. ¥4699
    HUAWEI Mate 80
    ·
  3. ¥5999
    苹果iPhone17
    ·
  4. ¥8999
    苹果iPhone17 Pro
    ·
  5. ¥2399
    iQOO Z11 Turbo
    ·
  6. ¥1999
    vivo Y600 Pro
    ·
  7. ¥3599
    荣耀500 Pro
    ·
  8. ¥3499
    一加Ace 6至尊版
    ·
  9. ¥1399
    荣耀X70
    ·
  10. ¥2199
    REDMI Turbo 5 Max
    ·
为您推荐
  • 相关阅读
  • 业界资讯
  • 手机通讯
  • 电脑办公
  • 新奇数码
  • 软件游戏
  • 科学探索