9月29日晚间,DeepSeek发布了DeepSeek-V3.2-Exp模型。据悉,这是一个实验性版本,作为迈向新一代架构的中间步骤。该模型在V3.1-Terminus基础上引入了DeepSeek Sparse Attention稀疏注意力机制,针对长文本的训练和推理效率进行了探索性优化和验证。
目前官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp版本,同时API价格大幅下调。新的价格政策下,开发者调用API的成本将降低50%以上。该模型现已在Huggingface与魔搭平台开源。
在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

粤公网安备 44010602000162号
网友评论