近日,中国移动自主研发的九天35B通用大模型即将正式发布。作为中国移动重要的生态合作伙伴及 “AI 能力联合舰队” 的核心算力成员,摩尔线程基于旗舰级AI训推一体全功能GPU MTT S5000,依托成熟的MUSA软件栈与高性能算子优化,已率先完成九天35B模型的全流程适配与推理验证。这不仅是国产GPU与央企大模型的深度协同,更意味着国产AI算力已具备支撑行业级大模型规模化落地的核心能力。
软硬协同优化,释放极致性能
本次适配中,摩尔线程基于自研MUSA 软件栈与SGLang-MUSA高性能推理引擎,深度打通九天35B模型推理全链路。MTT S5000基于第四代MUSA“平湖” 架构打造,单卡AI稠密算力可达1000 TFLOPS,支持从FP8到FP64全精度计算,为大模型推理提供了坚实的硬件底座,精准匹配九天35B大模型在长文本处理与高并发响应方面的核心需求。
为追求极致效率,摩尔线程通过MUSA C开发框架、muDNN计算库与MATE开源算子库的全栈优化,针对九天35B模型特有的注意力机制与长序列推理进行深度适配,确保模型在MTT S5000上高效执行。实测表明,在标准推理场景下,MTT S5000可稳定支撑九天35B模型的高并发请求,充分满足各行业对大模型低时延、高可靠的部署要求。
国产GPU+央企大模型,夯实全栈算力底座
中移九天35B大模型作为中国移动 “九天” 基座核心产品,具备高安全、高可控、全自主的央企特性,已通过生成式AI服务双备案与A级安全认证,广泛适配数智化转型场景。此次摩尔线程MTT S5000快速完成适配,不仅验证国产GPU生态成熟度与响应速度,更构建 “国产 GPU + 央企大模型” 全栈国产化方案,为中国移动算网融合、AI 能力规模化输出提供关键支撑,助力千行百业智能化升级。
作为中国移动深度生态伙伴,摩尔线程积极参与移动云智算中心、万卡级集群建设,近期更联合中国移动研究院、之江实验室等产业伙伴,共同发布《OISA高密超节点参考设计技术规范》,推动国产AI算力基础设施的标准化与高密度演进。未来,摩尔线程将持续依托AI智算产品与MUSA全栈技术,携手中国移动及更多产业伙伴,深化智算基础设施与AI应用的协同创新,加速构建自主可控、高效可靠的新一代AI基础设施,为千行百业智能化升级提供坚实底座。


粤公网安备 44010602000162号
网友评论