据悉,中国工程院院士、清华大学计算机系教授郑纬民指出,在训练人工智能大模型时,采购超级计算服务或存储器是缓解算力焦虑的新途径。他表示,将大模型训练放到超算上进行,价格仅为英伟达的六分之一。此外,他还分享了以存换算思路帮助AI推理发展的新趋势,并介绍了月之暗面与清华大学共同开发的Mooncake技术框架。在该框架中通过提炼用户对话公共内容并存储起来,节省了每次重新生成过程和资源消耗。郑纬民建议企业尝试采用超算来进行AI大模型训练,因为国内超级计算机收费便宜且性能可靠。
据悉,中国工程院院士、清华大学计算机系教授郑纬民指出,在训练人工智能大模型时,采购超级计算服务或存储器是缓解算力焦虑的新途径。他表示,将大模型训练放到超算上进行,价格仅为英伟达的六分之一。此外,他还分享了以存换算思路帮助AI推理发展的新趋势,并介绍了月之暗面与清华大学共同开发的Mooncake技术框架。在该框架中通过提炼用户对话公共内容并存储起来,节省了每次重新生成过程和资源消耗。郑纬民建议企业尝试采用超算来进行AI大模型训练,因为国内超级计算机收费便宜且性能可靠。
网友评论