Workflow
智能体自己出现问题自己找!首次提出“自动化失败归因”课题 | ICML2025 Spotlight
量子位·2025-06-11 10:27

近年来,LLM Multi-Agent系统引起广泛关注。它们各显神通,协同作战解决复杂难题。然而,一顿操作猛如虎,最终结果却"惨不忍睹",一 整个任务失败。 这时候,你是不是头都大了: 究竟是哪个环节的哪个Agent出了岔子? 允中 发自 凹非寺 量子位 | 公众号 QbitAI 在日益复杂的Multi-Agent系统中,由于Agent之间自主协作、信息链条长,失败不仅常见,而且诊断起来极其困难。如果我们不能快速定位 失败的根源,系统的迭代和优化就无从谈起。 针对这个问题,宾夕法尼亚州立大学与杜克大学联合Google DeepMind等机构的研究者们首次提出了"自动化失败归因"这一全新研究课题, 并为此构建了首个专用基准数据集Who&When,开发和评估了多种自动化归因方法。 这项工作不仅深刻揭示了该任务的复杂性,也为未来提升LLM Multi-Agent 系统的可靠性开辟了新的道路。 该论文获ICML 2025 Spotlight,代码与数据集已全部开源。 首次提出"自动化失败归因"课题 LLM驱动的Multi-Agent系统在很多领域展现出巨大潜力。然而,这些系统也存在着脆弱性:单个Agent的失误,Ag ...