京东云JoyBuilder模型开发平台近日完成升级,成功支持GR00T N1.5模型的千卡训练,成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台。升级后训练效率较开源社区版本提升3.5倍,1亿+数据的千卡训练时间从15小时缩短至22分钟。
在具身数据链路优化方面,平台通过重构数据处理流程实现CPU与GPU异步执行,自研的高性能并行文件系统云海JPFS支持高并发访问,在1024卡集群上读取带宽超过400GB/s。
在模型计算优化方面,针对VLA模型特点从Attention层、Token裁剪等多方位进行优化。基础设施方面搭建3.2T RDMA网络,保障千卡间通信的高吞吐与低延迟,支持长周期稳定训练。
京东云JoyBuilder平台通过全链路优化,支持当前主流的LeRobot训练数据最新协议,成为行业首家支持具身模型千卡级开源训练框架的AI开发平台。

粤公网安备 44010602000162号
网友评论