首页 > 热点播报 > 正文

阿里千问3发布并开源 参数仅为DeepSeek-R1三分之一

阿里巴巴开源了新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,宣布成本大幅下降,性能超越R1、OpenAI-o1等领先模型。

据悉,千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T tokens,并在后训练阶段经过多轮强化学习,将非思考模式无缝整合到思考模型中。

千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。性能大幅提升的同时,部署成本还大幅下降,仅需4张H20即可部署满血版。

网友评论

热门IT产品
  1. ¥4699
    HUAWEI Mate 80
    ·
  2. ¥5999
    HUAWEI Mate 80 Pro
    ·
  3. ¥9999
    苹果iPhone17 Pro Max
    ·
  4. ¥2399
    一加 Ace 6T
    ·
  5. ¥5999
    苹果iPhone17
    ·
  6. ¥3599
    荣耀500 Pro
    ·
  7. ¥1399
    荣耀X70
    ·
  8. ¥2999
    vivo S50
    ·
  9. ¥6999
    Xiaomi 17 Ultra
    ·
  10. ¥5299
    OPPO Find X9 Pro
    ·