首页 > 热点播报 > 正文

DeepSeek-V3.2-Exp模型正式开源并降价 稀疏注意力机制提升长文本效率

9月29日,DeepSeek正式发布实验性版本V3.2-Exp模型。该版本在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行了优化。

官方表示,DSA首次实现细粒度稀疏注意力机制,在几乎不影响模型效果的前提下大幅提升效率。为严谨评估改进效果,V3.2-Exp的训练设置与V3.1-Terminus保持严格对齐,评测表现基本持平。

目前官方App、网页端和小程序均已更新至V3.2-Exp版本。虽然该版本已在公开评测集验证有效性,但仍需用户在实际场景中进行更大规模测试。为方便对比,官方临时保留V3.1-Terminus的API接口。

DeepSeek-V3.2-Exp模型现已在Huggingface与魔搭平台开源,相关论文也已同步公开。

网友评论

热门IT产品
  1. ¥5999
    苹果iPhone17
    ·
  2. ¥9999
    苹果iPhone17 Pro Max
    ·
  3. ¥5999
    Xiaomi 17 Pro Max
    ·
  4. ¥4699
    HUAWEI Pura 80
    ·
  5. ¥1399
    荣耀X70
    ·
  6. ¥2699
    HUAWEI nova 14
    ·
  7. ¥3399
    荣耀400 Pro
    ·
  8. ¥4399
    vivo X300
    ·
  9. ¥2799
    OPPO Reno14
    ·
  10. ¥6499
    vivo X200 Ultra
    ·