控制论
搜索文档
一文讲透Agent的底层逻辑
虎嗅· 2025-10-22 22:47
AI Agent核心观点 - AI Agent能力的质变关键不在于底层大模型智力的增长,而在于围绕模型设计的有效"认知流程" [3] - 行业对Agent存在两种认知误区:过度神秘化或过度简化,导致沟通成本很高 [1][2] - 从Chatbot到Agent的进化是从"优雅的文本统计模仿"转向"可靠的行动派"的本质转变 [47][52] Agent能力演进阶段 - 阶段一原生天才:对应基础API调用,一次性黑盒生成答案,无法保证可靠性 [20] - 阶段二思考者:引入思维链(CoT)流程,将复杂任务分解为线性推理子任务,降低幻觉概率 [22] - 阶段三细心人:通过自我反思(Reflexion)框架实现"先行动、再复盘、后修正"的迭代流程,在HumanEval代码生成任务上达到91%准确率,超越GPT-4的80%记录 [25][26] - 阶段四战略家:具备规划能力,将宏大目标分解为逻辑清晰的子任务清单,提升执行效率和确定性 [29] - 阶段五学者:通过ReAct框架实现思考->行动->观察循环,将AI从封闭大脑转变为能与现实世界互动的行动者 [31][34][38] 流程驱动的三重价值 - 结构价值:用规划(Planning)和思维链(CoT)等流程为AI思考建立逻辑脚手架,对抗思维混沌 [56][59] - 迭代价值:通过反思(Reflection)和总结(Summarization)流程为记忆打造压缩算法,实现长期记忆演化 [61][64] - 交互价值:通过工具使用(Tool Use)连接现实世界,确保获取真实质量而非高质量幻觉 [65][67] 理论基础与科学原理 - 控制论视角:Agent工作流程对应闭环控制系统,通过反馈机制实现从开环到闭环的进化 [74][78][84] - 信息论视角:Agent工作是通过行动获取信息进行熵减的过程,系统性地消除不确定性 [86][90][91] - 两个理论共同为Agent框架的可靠性与有效性提供坚实科学基石 [94] 开发者角色转变 - 从"提示词工程师"转变为"Agent流程架构师",核心价值体现在思考结构、记忆机制和世界交互范式的设计上 [72][98][99] - 新角色三大核心职责:设计AI思考流程、赋能AI行动工具、构建AI决策上下文 [100][101][102] - 行业竞争力核心从模型参数大小转向智能流程优劣,LLM应用未来取决于流程设计 [96] 性能工程与架构演进 - 架构选型与剪枝:对简单场景使用LLM内置工具调用范式,降低token消耗和延迟 [106] - 并行化执行:通过异步I/O实现并行工具调用,将总耗时从"所有任务耗时之和"缩短为"最长任务耗时" [106] - 模型特化与路由:采用混合模型策略,轻量模型处理高频任务,重量模型处理复杂推理 [115] - 高效记忆架构:设计精准的记忆检索机制,以最低Token成本注入最关键信息 [115] 前沿架构探索方向 - 认知调度中心:实现智能工作流编排,如Anthropic的"Skills"功能允许模型自主选择、组合并调用多个工具 [108] - 规约驱动分层架构:通过技术规约(Specification)实现多Agent可靠协作,进化为可追溯的现代软件工程 [109] - 即时代码生成:让Agent从"使用工具"进化到"创造工具",通过CodeAct等框架动态生成代码扩展能力边界 [110]
Agent 一年半开发复盘:大家对 Agent 的理解有错位,有效的「认知流程」很关键
Founder Park· 2025-10-22 20:46
AI Agent核心观点 - AI Agent能力的质变关键不在于大模型智力增长,而在于围绕模型设计的认知流程[2] - 从Chatbot到Agent的进化本质是从静态生成转向动态执行流程[33] - 行业竞争核心已从模型参数转向智能流程设计优劣[62] Agent能力演进路径 - 学霸成长比喻展示Agent五阶段演进:原生天才→思考者→细心人→战略家→学者[15] - 思维链(CoT)强制模型分解复杂任务为线性推理子任务,降低幻觉概率[18] - 自我反思(Reflexion)框架引入"先行动-再复盘-后修正"迭代流程,HumanEval代码任务准确率达91%超越GPT-4的80%[20] - 规划能力将宏大目标分解为逻辑清晰子任务清单,提升执行确定性[22] - ReAct框架通过思考→行动→观察循环将AI从封闭大脑变为现实世界行动者[26] 流程设计三重价值 - 结构价值:规划流程在宏观层面建立逻辑脚手架,思维链在微观层面确保推理严谨[36][37] - 迭代价值:反思流程对记忆进行高效压缩,用极小上下文空间保留关键决策信息[42] - 交互价值:工具作为流程神经触手,通过ReAct框架确保AI获取真实世界信息[46][47] 科学理论基础 - 控制论视角:Agent实现从开环系统到闭环系统进化,通过反馈机制持续逼近目标[53][54] - 信息论视角:Agent工作本质是熵减过程,通过行动获取信息消除不确定性[59][60] 开发者角色转变 - 提示词工程师角色正成为历史,新兴角色是Agent流程架构师[64][65] - 新角色三大核心职责:设计AI思考流程、赋能行动工具、构建决策上下文[66][68][69] - 基础Think-Act-Observe循环是Agent心跳,架构师需在此基础上构建大脑与神经系统[70] 性能工程优化 - 架构剪枝:简单场景使用LLM内置工具调用范式降低延迟[70] - 并行化执行:对无依赖子任务实施并行工具调用,将总耗时缩短为最长任务耗时[71] - 模型路由:轻量模型处理高频任务,重量模型仅用于复杂推理节点[71] - 记忆架构:高效检索机制精准提取关键时刻所需知识[72] 前沿架构方向 - 认知调度中心:Anthropic Skills功能实现智能工作流编排,模型自主规划多工具协作[73] - 规约驱动分层:规划Agent生成技术规约作为执行Agent工作契约[74] - 即时代码生成:CodeAct框架让Agent动态创建工具,实现能力边界动态扩展[75]