蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版。该版本主打“Agent一键接入RL训练”功能,无需修改代码即可兼容各类Agent框架,实现智能体强化学习训练开箱即用。
据悉,当前智能体框架存在两大瓶颈:一是接入训练成本高,不同框架接口各异导致适配困难;二是Agent部署后缺乏持续进化能力,能力上限在交付时便已确定。
AReaL是首个全异步训推解耦的大模型强化学习训练系统,能让Agent在真实任务交互中持续优化决策。v1.0版本通过Proxy Worker中转层技术,实现任意Agent零改造接入RL训练。

粤公网安备 44010602000162号
网友评论