首页 > 热点播报 > 正文

阿里发布国内首个“混合推理模型”Qwen3 并开源:支持两种思考模式 预训练约 36 万亿个 token、119 种语言和方言

4月29日消息,阿里巴巴发布了新一代通义千问 Qwen3 模型,将“快思考”与“慢思考”集成进同一个模型,大大节省算力消耗。经过后训练的模型已在各大平台上开放使用。同时,阿里云开源了多个 MoE 和 Dense 模型,在基准测试中表现出竞争力的结果。Qwen3 模型支持119种语言和方言,并且数据集扩展显著;为了构建庞大的数据集,从网络上收集数据并从PDF文档中提取信息等方式被采用。Qwen3 预训练过程分为三个阶段,并且具备较高性能和参数更少的优势。通过四阶段的训练流程实现混合模型,并提供软切换机制给用户动态控制模型行为

网友评论

热门IT产品
  1. ¥2899
    OPPO K15 Pro
    ·
  2. ¥3099
    OPPO K15 Pro+
    ·
  3. ¥1799
    vivo Y500s
    ·
  4. ¥1399
    荣耀X70
    ·
  5. ¥1299
    华为畅享90
    ·
  6. ¥1699
    华为畅享90 Pro Max
    ·
  7. ¥1999
    荣耀X80i
    ·
  8. ¥1999
    REDMI Turbo4 Pro
    ·
  9. ¥8999
    苹果iPhone17 Pro
    ·
  10. ¥6999
    vivo X300 Ultra
    ·