据悉,在韩国首尔举办的第31届操作系统原理研讨会上,阿里云展示了其创新的Aegaeon系统。该系统针对AI模型服务中的资源效率低下问题提出了解决方案。
研究人员发现,当前AI模型服务存在严重的资源闲置问题,用户请求往往集中在少数热门模型上。Aegaeon系统通过GPU资源池化技术,允许单个GPU动态服务多个AI模型,打破了传统绑定模式。
在为期三个月的测试中,Aegaeon系统仅用213张GPU卡就完成了原本需要1192张卡的工作量,GPU用量削减达82%。该系统由北京大学与阿里云合作研发,阿里云CTO周靖人也是论文作者之一。

粤公网安备 44010602000162号
网友评论