DeepSeek-V3.2-Exp模型正式开源并降价稀疏注意力机制提升长文本效率

2025-09-29 22:48 整合编辑：科仔播报

9月29日，DeepSeek正式发布实验性版本V3.2-Exp模型。该版本在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制，针对长文本训练和推理效率进行了优化。

官方表示，DSA首次实现细粒度稀疏注意力机制，在几乎不影响模型效果的前提下大幅提升效率。为严谨评估改进效果，V3.2-Exp的训练设置与V3.1-Terminus保持严格对齐，评测表现基本持平。

目前官方App、网页端和小程序均已更新至V3.2-Exp版本。虽然该版本已在公开评测集验证有效性，但仍需用户在实际场景中进行更大规模测试。为方便对比，官方临时保留V3.1-Terminus的API接口。

DeepSeek-V3.2-Exp模型现已在Huggingface与魔搭平台开源，相关论文也已同步公开。

相关阅读

网友评论

24小时内最火资讯

精彩图赏 热点视频

热门IT产品

未经授权禁止转载、摘编、复制或建立镜像，如有违反，追究法律责任。

增值电信业务经营许可证：粤B2-20040647

广播电视节目制作经营许可证：粤字第806号

举报邮箱：shenhezhiban@pconline.com.cn

DeepSeek-V3.2-Exp模型正式开源并降价 稀疏注意力机制提升长文本效率