首页 > 热点播报 > 正文

豆包提出全新稀疏架构 推理成本较MoE最高可降83%

收藏成功,去查看收藏>>

据悉,字节跳动豆包大模型团队近日提出了一种名为UltraMem的全新稀疏模型架构。

这项技术有效解决了MoE推理时高额的访存问题,同时将推理速度相比于MoE架构提升2-6倍。

更重要的是,该架构能够将推理成本最高降低83%。

此外,研究还揭示了新架构的Scaling Law,并证明其在性能上超越了MoE。

收藏 (0) +1 (0) +1 (0) +1

网友评论

网友评论
欢迎参与讨论,分享你的看法
最新评论
热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·
以科技敬生活
下载太平洋科技APP