文章核心观点 - 行业观点认为,AI应用的核心范式正从“编写提示词(Prompt Engineering)”转向“编写和管理循环(loop Engineering)”,其核心是设计一个让AI系统能够自主执行、验收并迭代任务的自动化管理机制,从而将人类从流程中解放出来[1][5][33][70] loop的概念与定义 - loop直译为“循环”,在AI领域指代一种系统:人类定义目标后,AI自主执行任务、自行验收结果,若不合格则带错重试,直至任务完成或达到预算上限,人类角色从而从“传话人”转变为“规则设计者”[2][11][12] - loop与Agent的关系是:Agent是执行具体任务的主体,而loop是管理Agent、使其能够持续自主工作的自动化机制,套用loop的Agent才能成为一个能自转的系统[13][15] loop的行业应用与产品格局 - 在产品落地层已形成“双雄对峙”格局:以Claude Code和OpenAI Codex为代表[18] - Claude Code围绕loop提供了三件套:/loop负责定时循环,/goal负责目标驱动(运行至满足验收条件),/schedule负责云端定时任务(合上电脑也能跑)[18] - Claude Code的关键设计原则是“自己不能判自己的卷子”,其架构将代码编写(由大模型负责)与验收(由独立的轻量模型Haiku负责)分离,以确保验收的约束力[19][20][21] - OpenAI Codex的玩法更接近“自动化流水线+目标驱动+多个子Agent”的组合,在实际体验中可见最多8个Agent同时在云端沙箱中并行工作[23] - 尽管实现路径不同,但两者最终形态高度相似:都将复杂任务拆分,交由多个Agent并行处理后再汇总结果[24] - 行业评测显示两者表现已非常接近,这表明模型本身能力差异已不大,真正的差距在于上层的loop编排与系统设计[25][26] 实践案例与工作模式转变 - “Claude Code之父”Boris Cherny的工作模式已完全转变:其手下有数百个小Agent同时运行,分别处理扫描GitHub issue、阅读Slack用户反馈、监控CI失败等任务,每个Agent在隔离的代码分支中工作,并配有独立的测试验收Agent[28] - 自Opus 4.5版本以来,其所有代码均由Claude Code编写,大部分工作可直接在手机上完成,仅当Agent无法处理的任务才会进入其收件箱等待人工判断[29][30] - loop的终极形态是:人类不再编写代码或提示词,仅负责制定规则和进行关键判断,其余工作全部交由loop系统自动完成[33] 如何实施loop:实操路线与关键原则 - 实施前需通过“4条件测试”判断任务是否适合loop:任务需重复发生、有自动化验收手段、Token预算可承受、Agent拥有“高级工程师”级别的工具权限[37][38][40] - 构建loop应从最小可行产品开始,遵循关键顺序:先手动跑通流程→固化为Skill→封装进loop→最后才设置定时触发,跳步是导致loop在生产环境失败的主要原因[41][42] - 核心设计原则是“写代码的和验代码的必须分开”,需使用不同的模型或子Agent分别负责编写与验收,且验收者不能看到编写者的推理过程,以防止模型自我评分过于宽松[42][43][45][46] - 一个基本的loop应包含四要素:一个触发器(如定时或事件触发)、一个技能(封装项目上下文)、一个状态文件(如STATE.md记录进度)、一个门禁(如自动测试等拦截机制)[44] - 需避免常见陷阱:设置硬停止条件(如Token上限、迭代次数上限、时间限制)以防无限循环;通过状态文件实现记忆持久化;避免让loop处理需要人类判断的任务(如架构重写、支付逻辑);建议人工阅读代码Diff以避免产生“理解力债务”[48][49] 衡量loop成效的关键指标 - 衡量loop成效的唯一关键指标是:每个被接受的代码改动的平均成本[50][51] - 如果代码的“被接受率”低于50%,则意味着人类仍在从事本应由loop节省的评审工作,表明loop处于亏损状态[52] 技术范式的演进路径 - 从2023年至2026年,AI工程范式经历了四次跃迁:从Prompt Engineering(关注如何编写提示词)→Context Engineering(关注为AI提供何种背景信息)→Harness Engineering(关注为AI搭建可调用工具和资源的运行环境)→loop Engineering(关注设计能让AI持续自主工作的循环系统)[55][60][61][67][68] - 这一演进路径的本质是人类对AI控制粒度的不断上移:从控制单句话,到控制信息集,再到控制系统环境,最终到控制系统运行循环,是一个逐步解放人类双手的连续过程[70][71] 学术渊源与技术发展 - loop的学术理念早有渊源,其雏形可追溯至2022年由姚顺雨等人提出的ReAct框架,该框架将“推理”和“行动”绑定成一个循环过程(思考→行动→观察→再思考),并获得了上万次的引用量[74][75][76][77] - 在ReAct之后,Reflexion、Tree of Thoughts等一系列研究工作逐步完善了“规划+执行+反馈”的完整链路,这些学术成果最终在工程界收敛为现今的loop系统[77][78][79] - 技术发展速度极快,从Prompt到loop的转变引发了行业兴奋,但也伴随着对Token成本和控制问题的担忧[80][82][83]
黄仁勋:Prompt正在过时,Loop才是新范式
量子位·2026-06-25 15:50