中科曙光国家先进计算产业创新中心有限公司宣布,海光信息技术团队已成功完成DeepSeek V3和R1模型与海光DCU的适配,并正式上线。用户可以在“光合开发者社区”中访问并下载相关模型,或搜索“DeepSeek”进行部署和使用。据介绍,这两个模型采用了Multi-Head Latent Attention(MLA)和DeepSeek MoE两大核心技术,提升了推理效率并优化了性能。DCU是一款高性能AI加速计算解决方案,在科教、金融、医疗等领域得到广泛应用。
中科曙光国家先进计算产业创新中心有限公司宣布,海光信息技术团队已成功完成DeepSeek V3和R1模型与海光DCU的适配,并正式上线。用户可以在“光合开发者社区”中访问并下载相关模型,或搜索“DeepSeek”进行部署和使用。据介绍,这两个模型采用了Multi-Head Latent Attention(MLA)和DeepSeek MoE两大核心技术,提升了推理效率并优化了性能。DCU是一款高性能AI加速计算解决方案,在科教、金融、医疗等领域得到广泛应用。
网友评论