据悉,微软推出Agent Lightning框架,该框架采用分层强化学习算法,可直接利用现有单次调用强化学习算法更新模型参数,无需修改任何代码。
该框架通过前后端分离架构,将LLM生成与应用程序逻辑分离,并集成OpenTelemetry等可观测性框架,使开发者能专注于Agent逻辑开发。
实验显示,在Text-to-SQL、开放域问答等任务中,该框架能稳定提升多Agent系统性能,支持选择性优化特定Agent组件。
研究团队还提出Component of Interest概念,支持prompt优化等方法,未来计划进一步分解系统组件,提升大规模强化学习训练效率。

粤公网安备 44010602000162号
网友评论