【太平洋科技资讯】9月21日消息,近日,在华为全联接大会2023上,华为常务董事汪涛正式发布了全新架构的昇腾AI计算集群Atlas 900 SuperCluster。这个新的计算集群具有强大的处理能力,可以支持超万亿参数的大模型训练。
Atlas 900 SuperCluster的出现,是华为在人工智能计算领域的一次重大突破。新集群采用了华为全新的星河AI智算交换机CloudEngine XH16800,这款交换机拥有高密的800GE端口能力,通过两层交换网络,就能实现2250节点(等效于18000张卡)超大规模无收敛集群组网。
此外,新集群还采用了创新的超节点架构,这一架构的使用,极大地提升了大模型训练能力。同时,华为也充分发挥了在计算、网络、存储、能源等领域的综合优势,从器件级、节点级、集群级和业务级全面提升系统可靠性,将大模型训练稳定性从天级提升到月级。
在这次大会上,华为还发布了更开放、更易用的CANN 7.0异构计算架构。这个架构不仅全面兼容业界的AI框架、加速库和主流大模型,还深度开放底层能力,让AI框架和加速库可以更直接地调用和管理计算资源,使能开发者自定义高性能算子,让大模型具备差异化的竞争力。
为了进一步提升开发效率,华为还升级了Ascend C编程语言,以更高效的编程方式,简化算子实现逻辑,大幅缩短融合算子的开发周期,为AI模型与应用的快速开发赋能。
汪涛表示,随着人工智能进入大模型时代,大算力正在成为人工智能发展的核心引擎。华为改变传统的服务器堆叠模式,以系统架构创新打造AI集群,实现算力、运力、存力的一体化设计,突破大算力瓶颈。
【知多D】
华为在7月7日举行的HDC.Cloud 2023开发者大会上,推出一款全新的人工智能产品——盘古Chat。
网友评论