来源:ArXiv AI 2026-01-21 05:00

POLARIS:后台自动化中代理 AI 的类型化规划和受控执行

代理 POLARIS 执行 策略 自动化
arXiv:2601.11816v1 公告类型:新 摘要:企业后台工作流程需要可审核、策略一致且操作可预测的代理系统,而通用多代理设置通常无法提供这些功能。我们提出了 POLARIS(集成系统的策略感知 LLM 代理推理),这是一个受控编排框架,它将自动化视为类型化计划合成并通过 LLM 代理进行验证执行。规划器提出结构多样、类型检查的有向无环图 (DAG),标题引导推理模块选择单个合规计划,并通过验证器门控检查、有界修复循环和编译的策略护栏来保护执行,这些策略护栏可在副作用发生之前阻止或路由副作用。 POLARIS 应用于以文档为中心的财务任务,可生成决策级工件和完整的执行跟踪,同时减少人为干预。根据经验,POLARIS 在 SROIE 数据集上实现了 0.81 的微 F1,并且在受控合成套件上,在保留审计跟踪的情况下实现了 0.95 至 1.00 的异常路由精度。这些评估构成了受治理的 Agentic AI 的初始基准。 POLARIS 为政策一致的 Agentic AI 提供了方法和基准参考。关键词 代理人工智能、企业自动化、后台任务、基准、治理、类型化规划、评估

相关文章推荐

返回首页