自我改进编码智能体(SICA)

搜索文档
成熟的编程智能体,已经学会升级自己的系统了
机器之心· 2025-05-05 11:40
编程智能体发展 - 编程智能体成为2025年最热门话题之一,学术与工业界正探索高效落地路径,手工设计解决方案可能被自主学习方案取代 [2] - 研究提出完全自我参照式元智能体编程方案,突破传统元智能体与目标智能体分离的限制 [2][6] SICA技术框架 - SICA运行循环类似ADAS,但动态选择表现最佳的智能体作为元智能体,并保留历史档案优化迭代 [4] - 效用函数量化智能体性能,权重分配为基准分数50%、成本25%、时间25%,超时惩罚系数0.5 [5] - 上下文结构包含系统提示、核心问题陈述及运行日志,支持KV缓存以减少延迟和成本 [8][10] 实验性能改进 - 在SWE Bench验证集中,SICA实现17%-53%的性能提升,尤其在文件编辑和符号导航任务中显著优化效率 [6][12] - LiveCodeBench任务改进较微弱,推理任务中因模型与系统交互问题导致提升有限 [13][14] - 文件编辑基准中,智能体从低效覆盖文件发展到差异编辑工具,符号导航任务通过AST定位器提升效果 [13] 技术实现特点 - SICA采用标准Python实现,无领域特定语言,提供可扩展的参考框架支持LLM后训练 [6] - 实验使用Sonnet 3 5和o3-mini模型,推理任务中模型与系统协同效果影响最终表现 [12][13]