据悉,开源大语言模型DeepSeek R1的低成本训练引发了关注。大摩认为,这一模型可能会对中国数据中心和软件行业产生深远影响。短期内,类似技术路线可能减少AI模型训练需求;长远来看,低成本模型推动推理需求增长。在软件行业方面,DeepSeek R1的影响或带来选择性小幅利好。然而,具体影响将取决于产品及其下游市场。
由于开源项目DeepSeek R1以远低于GPT的训练成本实现了相近性能水平, 大摩表示该技术有巨大潜力改变数据中心和软件行业格局。
此外, DeepSeek R1还引发了人们对采用高端GPU集群训练大型语言模型(LLM)必要性的争论, 该模型仅需要GPT 1/30 的训练成本却能达到与GPT相当的性能水平。
尽管这一技术可能给中国数据中心和软件行业带来积极影响, 但最后结果将取决于具体产品及其下游市场情况。
网友评论