首页 > 热点播报 > 正文

英伟达创造AI推理性能世界纪录

收藏成功,去查看收藏>>

3月19日,英伟达在NVIDIA GTC 2025上宣布其NVIDIA Blackwell DGX系统创下DeepSeek-R1大模型推理性能的世界纪录。据悉,在单个DGX系统上运行6710亿参数的满血DeepSeek-R1模型可实现每用户每秒超250 token的响应速度,最高吞吐量突破每秒3万token。通过硬件和软件的结合,他们自2025年以来成功将DeepSeek-R1 671B模型的吞吐量提高了约36倍。Blackwell架构与TensorRT软件相结合可实现显著的推理性能提升,并在对模型进行量化时精度损失微乎其微。

收藏 (0) +1 (0) +1 (0) +1

网友评论

网友评论
欢迎参与讨论,分享你的看法
最新评论
热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·
以科技敬生活
下载太平洋科技APP