首页 > 业界资讯 > 正文

阿里发布混合推理开源模型Qwen3 支持快/慢两种思考模式

【太平洋科技快讯】4月29日,阿里巴巴正式发布新一代通义千问大语言模型Qwen3,一举成为全球最强开源模型。

Qwen3最大的亮点在于其独特的混合推理架构。这是国内首个将“快思考”与“慢思考”集成进同一个模型的尝试。通过这种创新设计,Qwen3既能够针对复杂问题进行多步骤的深度推理,也能对简单任务进行快速响应。这种架构大大节省了算力消耗,有效平衡了性能和效率。

据悉,Qwen3拥有强大的多语言处理能力,支持包括简体中文、繁体中文、粤语在内的119种语言和方言。这一特性极大地拓展了Qwen3的应用范围,使其能够更好地服务于全球用户,满足不同语言环境下的需求。

为了满足不同用户的需求,阿里云开源了8款不同规模的Qwen3模型。其中包括两个MoE(Mixture of Experts)模型:Qwen3-235B-A22B和Qwen3-30B-A3B,分别拥有2350亿和300亿总参数,以及220亿和30亿激活参数。此外,还有六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。这些模型均在Apache 2.0许可下开源,用户可以根据自己的需求选择合适的模型。

Qwen3系列模型已通过GitHub和阿里云ModelScope平台开源,并采用Apache 2.0许可,支持免费商用。特别是其旗舰模型Qwen3-235B-A22B,仅需4张H20显卡即可部署,显存占用仅为同类模型的1/3,大大降低了部署成本和使用门槛。

网友评论

热门IT产品
  1. ¥4699
    HUAWEI Mate 80
    ·
  2. ¥1999
    iQOO Z10 Turbo Pro
    ·
  3. ¥5999
    HUAWEI Mate 80 Pro
    ·
  4. ¥9999
    苹果iPhone17 Pro Max
    ·
  5. ¥3599
    荣耀500 Pro
    ·
  6. ¥5999
    苹果iPhone17
    ·
  7. ¥1199
    iQOO Z10x
    ·
  8. ¥2699
    荣耀WIN RT
    ·
  9. ¥5299
    vivo X300 Pro
    ·
  10. ¥5299
    OPPO Find X9 Pro
    ·
为您推荐
  • 相关阅读
  • 业界资讯
  • 手机通讯
  • 电脑办公
  • 新奇数码
  • 软件游戏
  • 科学探索