来源:ArXiv AI 2025-12-05 05:00

PARC:一种用于稳健执行长期任务的自主自反射编码代理

PARC 任务 评估 自我 自主
arXiv:2512.03549v1 公告类型:新 摘要:我们介绍了 PARC,一种用于自主且稳健地执行长范围计算任务的编码代理。 PARC 建立在分层多代理架构之上,其中包含任务规划、执行以及从独立环境中评估自身行动及其结果并提供反馈的机制,即自我评估和自我反馈。这种设计使 PARC 能够检测并纠正高级战略错误并在无需人工干预的情况下保持进展。我们跨计算科学和数据科学任务评估 PARC。在材料科学中,它自主再现了锂离子传导和合金偏析研究的关键结果。特别是,它协调数十个并行模拟任务,每个任务需要大约 43 小时的计算、管理编排、监控和端到端纠错。在基于 Kaggle 的实验中,从最少的自然语言指令开始,PARC 进行数据分析并实施搜索策略,产生可与人类设计的基线竞争的解决方案。这些结果凸显了将分层多智能体系统与自我评估和自我反馈相结合的潜力,使人工智能系统能够进行独立、大规模的科学和分析工作。

相关文章推荐

返回首页