Deep Agents
搜索文档
模型不再是关键?LangChain 创始人:真正决定Agent 上限的是运行框架
AI前线· 2026-03-13 13:01
行业趋势:AI应用从单次生成迈向持续执行 - AI应用正从“单次生成”迈向“持续执行”,下一代软件系统将围绕全新的“智能体编排”架构展开,该架构负责让智能体自主规划、调用工具、编写代码、管理文件、压缩上下文、调度子智能体,并在长时程任务中保持连贯行动 [2] - 简单调用LLM API、套一层提示词就能做产品的时代已经走到尽头,整个软件基础设施层正在被重新书写 [2][3] 智能体架构的核心组件 - 现代智能体拥有四大核心统一组件:系统提示词、规划工具、子智能体、文件系统 [3][27] - **系统提示词**:驱动智能体,告诉它该做什么,类似于“标准作业流程”,通常由框架内置部分和用户定制部分合并而成 [18][20] - **规划工具**:生成计划并写入文件,作为智能体的“思维草稿本”指导行动,主流方式是将计划存在文本文件中供智能体参考,而非强制执行严格步骤 [21] - **子智能体**:用于隔离上下文,主智能体可启动子智能体执行任务并仅返回结果,其核心挑战在于智能体间的有效沟通 [22] - **文件系统**:本质是让LLM自己管理上下文窗口,用于卸载超大工具调用结果、进行摘要和持久化存储,关键是以文件系统接口暴露给LLM [25][26] 智能体的分类与发展 - 智能体主要分为两类:一类是低延迟、少调工具的**对话式智能体**;另一类是红杉资本提出的可长时间运行、做规划、保持连贯性的**长时程智能体** [11] - 长时程智能体最终大多表现为**编码智能体**,因为代码通用性强,且模型最擅长处理代码、Bash命令和文件编辑 [11] - 未来趋势是两类智能体形态融合,对话智能体在前台,后台启动异步运行的子智能体处理长时程任务,最终收敛到同一框架 [12] 模型与框架的关系 - LangChain创始人认为“框架才是未来,模型终将走向商品化”,框架是模型与环境交互的整套方式,是一套通用工具集 [3][14][16] - 框架极其重要,许多终端产品(如Manis、Claude Code)的核心秘诀在于其框架,而框架与上层UI之间的耦合非常紧密 [14][15] 智能体的其他关键能力与概念 - **技能**:本质是一堆文件(如skill.md),包含完成某事的指令或可执行脚本,采用“渐进式披露”原则,仅在LLM需要时加载,是让其自己管理上下文窗口的关键方式 [30] - **上下文压缩**:当上下文积累过多时进行精简,常见做法是保留最近N条消息,将更早的消息摘要后存入上下文,同时将原始完整消息存进文件系统 [32][34] - **记忆分类**:分为**语义记忆**(关于世界的事实,如RAG)、**情景记忆**(过去的交互记录)和**程序记忆**(“如何做某事”的指令,即智能体的配置如系统提示词、技能、工具) [35][38] - **沙盒**:智能体编写并运行代码所必需的安全执行环境,核心价值是提供架构上的隔离,防止提示注入泄露密钥等安全问题 [9][41][47] LangChain的产品演进与战略 - LangChain从早期开源框架,演进为包含LangGraph、Deep Agents、LangSmith及Agent Builder的“生产级智能体运行时” [4] - **LangChain 1.0**:彻底聚焦于“让LLM循环运行+调用工具”的核心模式,在LangGraph之上重构,保持极度中立和高度可配置 [52] - **LangGraph**:面向图结构工作流的框架,提供更强的结构化能力和可靠性,被视为“智能体运行时” [8][52] - **Deep Agents**:开箱即用的完整框架,内置规划工具、文件系统等现代智能体核心组件 [27][52] - **LangSmith**:核心是可观测性增强版,因为智能体输入范围广且LLM非确定性,使得运行轨迹的可观测、评估、调试比传统软件重要得多 [4][53][57] - 公司刚完成1.25亿美元新融资,下一步核心方向是全力投入商业化表现最强的可观测性,并补齐部署与无代码能力,朝完整的智能体工程平台推进 [4][61][63] 行业竞争与差异化壁垒 - 对于AI开发者而言,最大的差异化在于**指令、工具和技能**,即将行业流程知识编码成自然语言并配备相应工具,而非过度绑定于特定框架或模型 [9][37][64] - 企业真正的壁垒在于将行业知识转化为“指令+工具+技能”,这些价值不会随技术脚手架快速迭代而消失 [9][37]
LangChain 创始人警告:2026 成为“Agent 工程”分水岭,传统软件公司的生存考验开始了
AI前线· 2026-01-31 13:33
文章核心观点 - 以LangChain创始人Harrison Chase的观点为核心,阐述了“长任务Agent”的兴起正在从根本上改变软件工程范式,其核心差异在于系统行为不再完全由确定性代码决定,而是由非确定性的模型黑箱与代码共同决定,这要求开发、测试和调试方法发生根本性转变 [2][30] - 预测长任务Agent的落地将在2025年末到2026年进一步加速,2026年可能成为“长任务Agent元年”,这将对现有软件公司的竞争格局产生类似从本地部署到云转型的深远影响 [2][3] - 当前最成熟的长任务Agent应用是编程Agent,其核心算法是“让LLM在循环中运行”,而未来的进步将依赖于更聪明的上下文工程(如压缩、记忆)以及模型与框架/harness的共同进化 [7][13][21][24] 长任务Agent的定义、现状与案例 - **定义与拐点**:长任务Agent不只是多回合聊天,而是能在更长时间里持续执行、反复试错、不断自我修正的“数字员工”[2] 其真正起飞的拐点大约在2025年6-7月,以Claude Code、Deep Research、Manus等产品的爆发为标志 [21] - **核心应用形态**:目前最成熟、使用最多的案例是编程Agent [9] 其他优秀案例包括AI SRE(如Traversal公司的产品)和研究型Agent [9] 最“杀手级”的应用形态是让Agent长时间运行并产出“初稿”,然后由人类进行审阅和修改,这在编程、AI SRE、报告生成、金融研究和客服领域均有体现 [9][10] - **为何现在可行**:这是模型能力提升与工程框架/harness成熟共同作用的结果 [13] 模型方面,推理模型带来了巨大提升 [13] 工程方面,逐渐摸索出了上下文压缩、规划、文件系统工具等关键原语 [12][13] Agent工程范式的转变:从框架到Harness - **框架与Harness的区别**:框架是围绕模型的一层抽象,强调灵活性和基础设施,便于切换模型和封装组件 [11] Harness则更“有主张”,内置了明确的设计立场和最佳实践,例如Deep Agents默认提供规划工具和上下文压缩功能 [11][12] - **Harness的现状**:目前在Harness工程上做得最好的大多是编程类公司(如Claude Code、Factory、AMP),其性能差异不仅来自模型,更来自对“模型如何在harness中工作”的理解 [15][17] Harness往往与模型家族绑定紧密,不同模型家族可能需要不同的设计 [17] - **Harness的设计关键**:包括对模型训练偏好的理解(如OpenAI模型熟悉Bash,Anthropic提供显式文件编辑工具)、高效的上下文压缩机制、以及主Agent与子Agent的高效通信策略 [18] 许多公开的harness prompt长达几百行 [19] 构建Agent与传统软件开发的根本差异 - **逻辑来源与确定性**:传统软件的所有逻辑都写在代码里,是确定性的;而Agent的行为逻辑很大一部分来自模型本身,是一个非确定性的黑箱,必须通过实际运行才能理解其行为 [30] - **开发与调试核心**:传统软件的“真相来源”在代码中,而Agent的真相来源是代码与执行轨迹的组合 [32] 因此,追踪/执行轨迹成为理解、调试和团队协作的核心工具,其重要性远超过在传统软件中的应用 [30][31][33] - **开发流程**:构建Agent是一个更偏迭代式的过程,因为在发布前无法完全确定Agent会如何行动,需要通过更多轮次的交互和反馈来调整系统prompt或指令,使其行为符合预期 [34][35] 人类的判断和反馈被深度整合到开发与评估循环中 [39][40] 现有软件公司的挑战与机遇 - **面临的挑战**:工程范式的变化将重新筛选参与者,并非所有公司都能成功转型,类似当年从本地部署转向云 [2][36] 年轻团队可能因没有传统软件开发方式的先入之见而更快适应新范式 [36] - **潜在优势**:现有公司手中握有的高价值数据与API依然是王牌资产,能够较容易地暴露给智能体使用并产生真实价值 [3][37][38] 关于“如何使用这些数据”的指令和流程知识是新的竞争点,垂直领域创业公司(如金融领域的Rogo)通过注入行业知识获得了优势 [38] - **可能的护城河**:记忆功能可能成为真正的护城河,特别是在为特定任务构建的工作流型Agent中,记忆能让系统通过反思历史交互来改进自身,从而形成持续优化的体验优势 [52] 但实现安全且用户可接受的自我改进是关键挑战 [52] Agent能力栈与未来演进方向 - **核心能力组件**:文件系统访问能力被认为是长任务Agent的必备项,无论是真实还是虚拟文件系统,对于上下文管理、状态存储和中间结果回查都至关重要 [25][56] 代码执行环境是另一个高度看好的标配能力,其成熟度优于直接操作浏览器 [56] - **上下文工程演进**:未来的进步将来自更聪明的上下文管理方式,例如让模型自己决定何时进行上下文压缩,以及发展跨长时间尺度的记忆系统 [24] 记忆本质上是长期的上下文工程 [24] - **交互界面演进**:与长任务Agent协作的UI需要同时支持异步管理和同步对话模式 [53] 异步模式用于管理长时间运行或并行的多个Agent,同步模式则用于即时反馈和纠正 [53][55] 能够查看和协作的“工作区”状态(如文件、目录)是界面设计的重要部分 [54]
LangChain 创始人警告:2026 成为“Agent 工程”分水岭,传统软件公司的生存考验开始了
程序员的那些事· 2026-01-31 11:16
文章核心观点 - 软件工程范式正在发生根本性转变,从由确定性代码定义系统行为,转向由非确定性的AI模型(Agent)驱动,这要求全新的开发、测试和调试方法 [1] - 长任务Agent(Long Horizon Agents)在2025年末至2026年将加速落地,其能力远超多回合聊天,更像能在长时间内持续执行、试错和自我修正的“数字员工” [1] - 构建Agent不仅是给软件开发“加一层AI”,而是工程范式本身的变革,这将对现有软件公司的竞争格局和护城河构成挑战 [2] 长任务Agent的现状与拐点 - 长任务Agent的核心是让大语言模型在一个循环中自主运行和决策,这一设想因模型能力增强和支撑框架(Harness)的成熟而开始真正奏效 [6] - 当前最成熟的长任务Agent应用是编程Agent,其能力正在向AI SRE(站点可靠性工程)、研究型Agent(如分析事故日志)、报告生成、金融研究和客服等领域扩散 [7] - 长任务Agent的拐点大约出现在2025年6-7月,以Claude Code、Deep Research、Manus等产品的爆发为标志,其底层使用同一核心算法:让LLM在循环中运行 [18] - 对于许多程序员而言,Claude Opus 4.5模型可能是一个心理上的分水岭,标志着模型能力刚好强到足以支撑长任务Agent形态,从Scaffolding(脚手架)迈向了Harness(运行框架) [18] Agent工程的核心组件:模型、框架与Harness - **模型**:即大语言模型,负责输入和输出token [9] - **框架**:是围绕模型的一层抽象,便于切换模型并封装工具、向量数据库、记忆等组件,强调灵活性和无偏好性,属于基础设施 [9] - **Harness**:比框架更有“主张”,内置了明确的设计立场和最佳实践,例如默认提供规划工具、上下文压缩和文件系统交互能力 [9] - 模型与Harness是“共同进化”的关系,两年前难以预见基于文件系统的Harness会成为最优解之一,因为当时模型未被充分训练过此类模式 [10] - 几乎所有做编程Agent的公司都在自研Harness,性能差异不仅来自模型,更来自对“模型如何在Harness中工作”的理解 [14] 构建Agent与传统软件开发的根本差异 - **逻辑来源不同**:传统软件的所有逻辑都写在代码里;而Agent如何工作的逻辑,很大一部分来自模型本身这个黑箱,具有非确定性 [27] - **理解与调试方式不同**:理解Agent行为不能仅靠读代码,必须通过追踪其在真实运行中的每一步执行轨迹,这使得Tracing(如LangSmith)成为核心工具 [27][28] - **“真相来源”不同**:传统软件的真相在代码中;Agent的真相是代码与执行轨迹的组合,轨迹成为可观察的事实载体 [29] - **测试方式不同**:传统软件可依赖程序化测试;评估Agent需要引入人类判断,在线测试比离线测试更重要,因为行为在真实输入下才会“涌现” [29][36] - **开发过程不同**:构建Agent是一个更偏迭代的过程,因为在发布前无法确切知道Agent会怎么做,需要更多轮次迭代来调整系统提示或指令 [31][32] Agent时代软件公司的机遇与挑战 - **现有公司的资产价值**:传统软件公司拥有的数据和API依然是高价值资产,能够被暴露给Agent使用并产生真实价值 [34][35] - **新增的竞争要素**:关于“如何使用这些数据”的指令变得至关重要,这部分知识过去由人类掌握,现在需要被系统化并固化到Agent中 [35] - **潜在的护城河**:记忆功能可能成为Agent应用的真正护城河,因为基于历史交互的学习能显著提升特定任务下的体验和性能 [49] - **人员与心态**:Agent工程的采纳可能呈现“年轻化倾向”,许多团队成员是更初级的开发者,没有传统软件开发方式的先入之见 [33] - **转型难度类比**:从本地部署软件转向云的转型过程中,成功公司不多,因为工程范式变化会重新筛选参与者,Agent时代的转型可能面临类似挑战 [33] Agent的关键技术与未来方向 - **上下文工程**:是长任务Agent突破的核心,涉及压缩、子Agent、技能、记忆等围绕上下文管理的技术 [18] - **文件系统访问**:现阶段长任务Agent几乎必须拥有文件系统(或虚拟文件系统)访问能力,这对上下文管理(如存储中间结果、实现压缩)至关重要 [22][53] - **代码执行能力**:给Agent配备安全的代码沙箱环境以执行脚本,比直接操作浏览器更成熟、通用,是能力栈的关键部分 [52][53] - **记忆与自我改进**:让Agent通过反思执行轨迹来更新自己的指令或代码,是一种重要的自我改进形式,但需确保安全和用户可接受 [45][49] - **用户界面演进**:需要同时支持异步管理(如管理多个长时间运行的任务)和同步对话(用于即时反馈和纠正)模式,并能查看Agent修改的“状态” [50][51]