黄仁勋：Prompt正在过时，Loop才是新范式

文章核心观点 - 行业观点认为，AI应用的核心范式正从“编写提示词(Prompt Engineering)”转向“编写和管理循环(loop Engineering)”，其核心是设计一个让AI系统能够自主执行、验收并迭代任务的自动化管理机制，从而将人类从流程中解放出来[1][5][33][70] loop的概念与定义 - loop直译为“循环”，在AI领域指代一种系统：人类定义目标后，AI自主执行任务、自行验收结果，若不合格则带错重试，直至任务完成或达到预算上限，人类角色从而从“传话人”转变为“规则设计者”[2][11][12] - loop与Agent的关系是：Agent是执行具体任务的主体，而loop是管理Agent、使其能够持续自主工作的自动化机制，套用loop的Agent才能成为一个能自转的系统[13][15] loop的行业应用与产品格局 - 在产品落地层已形成“双雄对峙”格局：以Claude Code和OpenAI Codex为代表[18] - Claude Code围绕loop提供了三件套：/loop负责定时循环，/goal负责目标驱动（运行至满足验收条件），/schedule负责云端定时任务（合上电脑也能跑）[18] - Claude Code的关键设计原则是“自己不能判自己的卷子”，其架构将代码编写（由大模型负责）与验收（由独立的轻量模型Haiku负责）分离，以确保验收的约束力[19][20][21] - OpenAI Codex的玩法更接近“自动化流水线+目标驱动+多个子Agent”的组合，在实际体验中可见最多8个Agent同时在云端沙箱中并行工作[23] - 尽管实现路径不同，但两者最终形态高度相似：都将复杂任务拆分，交由多个Agent并行处理后再汇总结果[24] - 行业评测显示两者表现已非常接近，这表明模型本身能力差异已不大，真正的差距在于上层的loop编排与系统设计[25][26] 实践案例与工作模式转变 - “Claude Code之父”Boris Cherny的工作模式已完全转变：其手下有数百个小Agent同时运行，分别处理扫描GitHub issue、阅读Slack用户反馈、监控CI失败等任务，每个Agent在隔离的代码分支中工作，并配有独立的测试验收Agent[28] - 自Opus 4.5版本以来，其所有代码均由Claude Code编写，大部分工作可直接在手机上完成，仅当Agent无法处理的任务才会进入其收件箱等待人工判断[29][30] - loop的终极形态是：人类不再编写代码或提示词，仅负责制定规则和进行关键判断，其余工作全部交由loop系统自动完成[33] 如何实施loop：实操路线与关键原则 - 实施前需通过“4条件测试”判断任务是否适合loop：任务需重复发生、有自动化验收手段、Token预算可承受、Agent拥有“高级工程师”级别的工具权限[37][38][40] - 构建loop应从最小可行产品开始，遵循关键顺序：先手动跑通流程→固化为Skill→封装进loop→最后才设置定时触发，跳步是导致loop在生产环境失败的主要原因[41][42] - 核心设计原则是“写代码的和验代码的必须分开”，需使用不同的模型或子Agent分别负责编写与验收，且验收者不能看到编写者的推理过程，以防止模型自我评分过于宽松[42][43][45][46] - 一个基本的loop应包含四要素：一个触发器（如定时或事件触发）、一个技能（封装项目上下文）、一个状态文件（如STATE.md记录进度）、一个门禁（如自动测试等拦截机制）[44] - 需避免常见陷阱：设置硬停止条件（如Token上限、迭代次数上限、时间限制）以防无限循环；通过状态文件实现记忆持久化；避免让loop处理需要人类判断的任务（如架构重写、支付逻辑）；建议人工阅读代码Diff以避免产生“理解力债务”[48][49] 衡量loop成效的关键指标 - 衡量loop成效的唯一关键指标是：每个被接受的代码改动的平均成本[50][51] - 如果代码的“被接受率”低于50%，则意味着人类仍在从事本应由loop节省的评审工作，表明loop处于亏损状态[52] 技术范式的演进路径 - 从2023年至2026年，AI工程范式经历了四次跃迁：从Prompt Engineering（关注如何编写提示词）→Context Engineering（关注为AI提供何种背景信息）→Harness Engineering（关注为AI搭建可调用工具和资源的运行环境）→loop Engineering（关注设计能让AI持续自主工作的循环系统）[55][60][61][67][68] - 这一演进路径的本质是人类对AI控制粒度的不断上移：从控制单句话，到控制信息集，再到控制系统环境，最终到控制系统运行循环，是一个逐步解放人类双手的连续过程[70][71] 学术渊源与技术发展 - loop的学术理念早有渊源，其雏形可追溯至2022年由姚顺雨等人提出的ReAct框架，该框架将“推理”和“行动”绑定成一个循环过程（思考→行动→观察→再思考），并获得了上万次的引用量[74][75][76][77] - 在ReAct之后，Reflexion、Tree of Thoughts等一系列研究工作逐步完善了“规划+执行+反馈”的完整链路，这些学术成果最终在工程界收敛为现今的loop系统[77][78][79] - 技术发展速度极快，从Prompt到loop的转变引发了行业兴奋，但也伴随着对Token成本和控制问题的担忧[80][82][83]