Harness
搜索文档
超越 Chatbot:Long-horizon Agent 如何重新定义 AI 产品形态|Jinqiu Select
锦秋集· 2026-02-05 19:40
AI Agent产品形态的范式转移 - Chatbot作为主流AI产品形态已显疲态,其“一问一答”的即时响应模式难以解决复杂问题,本质是产品形态而非模型能力的问题 [3][4] - 真正有价值的日常工作需要“长程执行者”,即能够自主进行多步骤决策、调整策略并花费时间完成任务的AI Agent [5] - 行业转折点出现在2025年年中,标志是Claude Code爆发式增长、Deep Research类产品涌现以及Manus等SuperAgent流行,AI从“聊天框里的打字机”转变为“能够独立作业的数字员工” [7] Long-horizon Agent(长程智能体)的核心与应用 - Long-horizon Agent定义为能在数分钟至数小时内自主运行的智能体,其核心是让大语言模型在循环中自主决定下一步行动 [16][17] - 该类型智能体具备三个核心特征:运行时间更长、拥有自主决策能力、产出“初稿”而非最终产品 [20] - 当前典型应用场景包括:Coding(如Claude Code、Cursor)、AI SRE(如Traversal的AI SRE Agent)、研究与报告生成(如Deep Research类产品)、高级客户支持 [20] AI Agent技术栈的演进:从Model到Harness - 技术栈分为三层:最底层是Model(模型),由OpenAI、Anthropic等厂商提供;中间层是Framework(框架),如LangChain,提供对工具、记忆等组件的抽象;最上层是Harness(运行时套件) [22][23] - Harness是“开箱即用”的Agent运行时环境,内置了构建Long-horizon Agent所需的最佳实践,如规划能力、上下文压缩、记忆管理、子任务协调和预设提示词模板 [11][23] - 行业竞争重心正从Framework转向Harness,因为当模型能力跨越关键阈值后,真正的竞争在于谁能提供更好的、内置最佳实践的运行时环境 [11][24] AI Agent发展的三个阶段 - 第一阶段为简单的Prompting和Chaining时代,模型仅有基础的文本输入输出能力 [28] - 第二阶段为Cognitive Architecture时代,模型开始具备工具调用和一定规划能力,开发者需构建复杂的“脚手架”来支撑 [30] - 第三阶段为Long-horizon Agent时代(2025年中至今),模型能力足够强大,行业焦点从构建“脚手架”转向提供“Harness”,以优化上下文工程 [31][32] 2026年关键技术方向与核心竞争力 - 模型能力已跨越关键阈值,推理、工具调用和长上下文处理能力使Long-horizon Agent从演示变为实用工具 [33] - Context Engineering(上下文工程)成为核心竞争力,其本质是构建动态系统,在正确时机以正确格式向模型提供正确的信息和工具 [29][34] - 在Agent开发中,Trace(运行完整记录)取代代码成为新的“真相来源”,这使得可观测性工具变得至关重要 [36][41] - Memory(记忆)能力可能成为产品的关键护城河,能够从运行记录中学习并自动更新指令的Agent将具备巨大优势 [42][43] - 文件系统访问能力是Long-horizon Agent的标配,对上下文管理有巨大帮助,且未来的通用Agent很可能都具备强大的编码能力 [44][46][47]
Zed 为什么不用自己造 Agent?OpenAI 架构师给出答案:Codex 重划 IDE × Coding Agent 的分工边界
AI前线· 2026-01-21 15:00
Coding Agent的构成与核心架构 - 一个Coding Agent由三部分组成:用户界面、模型和Harness(工具集)[4] - Harness是直接与模型交互的核心Agent循环,由一系列提示和工具组合而成,为模型提供输入和输出[4] - 将模型与Harness一同开发,能更好地理解模型的行为,这是Codex作为集成系统的优势所在[5][10] 构建高效Harness面临的挑战 - 新工具适配问题:为Agent提供模型从未见过或不擅长使用的创新工具时,需要花费时间根据模型特点调整Prompt[8] - 延迟与用户体验:模型处理问题需要时间,需设计提示以避免延迟过长,并决定如何向用户展示模型的思考过程[9] - 上下文窗口与数据压缩:管理上下文窗口和数据压缩是一大难题,需决定何时触发压缩及重新注入数据[9][12] - API接口变化:API接口不断变化(如完成功能、响应功能),需确保模型能熟练使用新工具以发挥最大智能[9] - Prompt设计复杂性:将模型适配到Harness中需要大量的Prompt设计,需理解模型的“习惯”(即训练形成的解决问题方式)[9][10] Codex作为Harness/Agent的功能与能力 - Codex被设计成适用于各种编程环境的Agent,可作为VS Code插件、CLI工具使用,或通过云端调用[12] - 核心功能包括:将提示想法转化为可运行代码、在代码仓库中导航并编辑文件、执行命令和任务、审查PR[12] - Harness需处理复杂任务:并行工具调用、线程合并、安全性(沙箱管理、权限设置)、数据压缩和上下文优化[12] - 能力扩展:Codex不仅能处理Coding任务,任何能通过命令行工具表达的任务(如整理文件、分析CSV数据)都能执行[13] 利用Codex构建自定义Agent的模式与集成 - 关键模式是使Harness成为新的抽象层,开发者无需在每次模型升级时优先优化提示和工具,可将精力集中于产品的差异化功能[5][15] - Codex提供多种集成方式:作为SDK通过TypeScript或Python库调用、提供GitHub动作自动合并PR冲突、可添加到AgentSDK并提供MCP连接器[15] - 企业级应用:可构建能为每个客户即时编写插件连接器的软件,实现完全可定制化,并具备自我对话与自动修复bug的能力[17] - 合作伙伴案例:GitHub利用Codex SDK成功集成;Cursor团队通过将其Harness与开源的Codex CLI对接,优化了系统性能[18] Codex的发展现状与未来展望 - Codex是增长最快的模型之一,每周服务数十万亿个token,该数字自开发日以来已翻了一番[18] - 未来模型将变得更强大,能处理更长周期的任务且无需监督,对新模型的信任度将进一步提高[18] - 未来重点将是处理庞大代码库和非标准库,支持在闭源环境中工作并匹配现有模板和实践[5][19] - SDK将持续发展,以更好地支持模型能力,使模型能在执行任务中不断学习,并为解决终端问题的Agent提供更多支持[19]
Zed 为什么不用自己造 Agent?OpenAI 架构师给出答案:Codex 重划 IDE × Coding Agent 的分工边界
AI前线· 2026-01-17 14:25
Coding Agent的构成与核心价值 - Coding Agent由三部分组成:用户界面、模型和Harness [3] - 用户界面可以是命令行工具、集成开发环境或云端/后台Agent [3] - 模型可以是GPT-5.1系列或其他供应商模型 [3] - Harness是核心Agent循环,由一系列提示和工具组合而成,作为模型与用户、代码交互的媒介 [3][6] - 将模型与Harness一同开发,能更好地理解模型行为,这是Codex作为集成系统的优势所在 [4][8] - 单纯在模型上构建包装器忽视了基础设施层的整体价值,应将精力集中在让产品脱颖而出的差异化功能上 [4][12] Harness构建的挑战与设计原则 - Harness构建面临多项挑战:处理模型未见过的创新工具、根据模型特点调整提示、管理模型响应延迟、设计用户体验以展示模型思考过程、管理上下文窗口和数据压缩、适应不断变化的API接口 [6] - 将模型适配到Harness需要大量的提示设计,模型的行为可理解为“智能”加上“习惯” [7] - 理解模型的习惯是成为优秀提示工程师的关键,应让模型按照其习惯的方式工作,而非过度引导 [8] - 例如,GPT-5模型若被过度引导查看所有内容,会导致响应速度慢,效果不如预期 [8] Codex系统的功能、集成与用例 - Codex被设计成适用于各种编程环境的Agent,可作为VS Code插件、CLI工具使用,或通过VS Code插件、手机上的ChatGPT在云端调用 [9] - 其基础功能包括:通过提示将想法转化为可运行代码、在代码仓库中导航并编辑文件、执行命令和任务、从Slack或GitHub调用以审查PR [9] - Codex的Harness需要处理复杂任务:并行工具调用、线程合并、安全性(沙箱管理、提示语转发、权限设置、端口管理)、数据压缩和上下文优化 [9] - Codex的应用场景广泛:从整理桌面照片到分析文件夹中大量的CSV文件进行数据分析,只要任务能以命令行及文件任务形式表达,Codex就能执行 [10] - Codex是一个SDK,可通过TypeScript库或Python调用,还提供GitHub动作以自动合并PR冲突,并可添加到AgentSDK中,为产品提供MCP连接器 [12] - 公司可与客户合作,将Codex嵌入到产品中,例如Zed将其嵌入IDE层级,专注于打造最好的代码编辑器,而GitHub等顶级合作伙伴已利用该SDK直接集成Codex [15] 行业趋势与Codex发展前景 - Coding领域是应用人工智能最活跃的前沿之一,新模型不断发布,团队需不断调整Agent以适应新模型 [5] - 未来将是关于庞大代码库和非标准库的时代,模型需支持在闭源环境中工作、匹配现有模板和实践 [4][16] - Codex Max推出后变化迅速,目前是增长最快的模型,每周服务数十万亿个token,该数字自开发日以来已翻一番 [16] - 预计模型将变得更强大,能处理更长周期的任务且无需监督,新模型的信任度将进一步提高,能够处理比六个月前更复杂的工作 [16] - SDK也将不断发展,以更好地支持模型能力,使模型能在执行任务过程中不断学习,避免重复错误,并为写代码和使用终端解决问题的Agent提供更多支持 [16]