首页 > 业界资讯 > 正文

曝DeepSeek-R2将于下月发布 总参数量达1.2万亿

【太平洋科技快讯】近日,据相关曝料透露,深度求索计划于下个月发布其下一代AI大模型DeepSeek-R2。据悉,该模型在性能和成本上都取得了显著突破,并实现了全产业链的自主可控,有望对现有AI服务市场产生重大影响。

DeepSeek-R2采用了混合专家模型(MoE)架构,并结合了智能门控网络层(Gating Network),以优化高负载推理任务的性能。这种架构通过动态分配计算资源,使得模型能够更灵活、高效地处理复杂任务。此外,DeepSeek-R2的总参数量达到1.2万亿,几乎是上一代DeepSeek-R1的6710亿参数的两倍。

在训练和推理性能上,DeepSeek-R2表现出色。基于华为昇腾910B芯片集群进行训练,该模型在FP16精度下达到512 PetaFLOPS的计算能力,芯片使用效率高达82%,这一性能相当于英伟达上一代A100训练集群的91%。在推理方面,DeepSeek-R2的速度达到每秒320 tokens,比前代模型有显著提升,并且在复杂逻辑推理任务上的准确率提升了83%。

此外,DeepSeek-R2预计将比GPT-4的成本降低97%,这预示着其可能颠覆现有AI服务的定价模式。分析师预计,DeepSeek-R2的定价将显著低于OpenAI的同类产品,这无疑将极大地提升其市场竞争力。

网友评论

热门IT产品
  1. ¥4699
    HUAWEI Mate 80
    ·
  2. ¥5999
    HUAWEI Mate 80 Pro
    ·
  3. ¥1199
    iQOO Z10x
    ·
  4. ¥9999
    苹果iPhone17 Pro Max
    ·
  5. ¥5999
    苹果iPhone17
    ·
  6. ¥3599
    荣耀500 Pro
    ·
  7. ¥2699
    荣耀WIN RT
    ·
  8. ¥1499
    iQOO Z9
    ·
  9. ¥2399
    一加 Ace 6T
    ·
  10. ¥1799
    vivo Y300 Pro
    ·
为您推荐
  • 相关阅读
  • 业界资讯
  • 手机通讯
  • 电脑办公
  • 新奇数码
  • 软件游戏
  • 科学探索