Workflow
自主Agent
icon
搜索文档
红杉专访 OpenAI Codex 团队:AI Coding 的未来,应该是异步自主 Agent
Founder Park· 2025-06-11 22:39
产品定位与核心功能 - Codex Agent 是 OpenAI 推出的全新编程模型 codex-1,能够并行处理多个任务并独立完成编程全流程,目标是从「代码补全」升级为「任务委托」的助手 [1] - 产品核心理念是让 AI 在云端独立环境异步完成任务并交付完整方案,而非仅提供实时代码补全 [6] - 模型与 o3 同源但通过强化学习微调,重点解决从「优秀程序员」到「优秀软件工程师」的转变,学习专业开发者的工程实践品味和偏好 [6][14][27] 技术实现与创新 - 采用容器化环境统一训练和生产环境,解决现实代码库缺乏一致测试框架和文档标准的难题 [6][28] - 模型支持长时间任务执行(最长30分钟),具备制定计划、引用工作成果和输出验证信息的能力 [29][34][37] - 训练重点包括 PR 描述规范、代码风格一致性、测试验证等工程实践细节,相当于为模型补足「三年工作经验」 [15][27] 行业影响与未来趋势 - AI 编程将大幅降低开发门槛,预计专业软件开发者数量增加而非减少,催生更多个性化软件需求 [6][25][26] - 开发者角色将从编码转向审查、验证和高层规划,顶尖用户每天可通过 Codex 完成超10个 PR [21][26] - 2025年可能成为「Agent 之年」,编程交互方式将融合同步与异步体验,界面可能类似 TikTok 信息流 [54][49][52] 产品生态与战略 - OpenAI 愿景是未来仅保留通用助手 ChatGPT,通过接入专用工具实现多功能,而非构建独立智能体 [6][39][48] - Codex CLI 作为终端环境中的协同工具,与云端独立工作的 Codex Agent 形成互补 [13][38] - 竞争优势在于模型泛化能力,可结合 Operator、Deep Research 等其他 Agent 获取外部上下文信息 [47][48] 用户体验优化 - 采用「富足心态」使用模式更高效,建议并行运行多个任务并接受多次尝试 [6][19] - 修复 Bug 是典型优势场景,能自主验证问题并提供可行方案 [17][18] - 任务粒度设计是关键挑战,建议先通过「提问模式」生成高级计划再细化执行 [30][31]
Windsurf团队科普Agent:不是什么都叫智能体!
Founder Park· 2025-04-25 21:29
Agent核心概念解析 - Agent系统本质是「LLM+工具」的循环结构 接收用户输入后交替调用推理模型和工具 推理模型决定行动步骤 工具执行具体操作并将结果反馈至信息流[5][6] - 推理模型的核心功能是选择工具和参数 而非单纯生成内容 其输出包含行动原因解释和结构化参数指令 工具则独立于LLM 涵盖计算器 系统时间等非文本功能[6][8] - 典型误用场景包括将思维链提示(CoT)等同于Agent推理 或混淆AI工作流与Agent系统 前者是LLM内部思考过程 后者是预设流程缺乏实时工具决策能力[8] Agent系统优势与分类 - 协作式Agent通过人类实时干预降低可靠性门槛 当前主流应用如Windsurf Cascade GitHub Copilot Workspaces均采用此模式 与完全自主Agent形成技术路径差异[16][17] - 工具集成弥补LLM短板 如数学计算 实时数据获取等 使系统能力突破文本生成限制 同时支持状态改变类操作(如发送短信) 超越RAG系统的信息检索范畴[12] - 发展历程显示 Copilot式单次调用系统率先落地 而AutoGPT(2023)和Devin等自主Agent受限于端到端可靠性 尚未大规模普及[13][15] Agent系统构建关键问题 - 工具生态决定能力边界 需评估工具独特性(如Windsurf网页解析技术)和扩展性 同时数据访问需平衡范围与控制 如代码库访问深度影响效果但增加权限复杂度[22][23] - 延迟优化涉及全技术栈 包括模型推理加速 提示工程缓存 工具并行化等 需权衡质量与响应速度 高延迟会放大失败成本[26] - 用户体验设计包含意图捕捉(隐式信号利用) 改动可视化审查(如IDE多文件修改) 以及非Agent功能融合 避免过度Agent化简单任务[24][27][29] 行业发展趋势 - 「苦涩的教训」警示过度依赖人工设计的风险 算力增长可能使定制化提示 工具选择等投入失效 需保持技术路径灵活性[31] - 协作式Agent现阶段更符合商业落地需求 因其降低了对LLM绝对可靠性的依赖 通过人机协同实现可控产出[17][19]