Workflow
OpenAI的“Agent时刻”:智能体大战来到分水岭?
虎嗅APP·2025-08-04 19:04

通用AI代理技术路径分析 - OpenAI发布通用型ChatGPT Agent 整合深度研究工具Deep Research与执行工具Operator 实现一站式复杂任务处理 但存在速度慢、个性化不足等短板 [4] - 主流Agent底层架构分为四种:基于浏览器的万能型、浏览器+沙盒虚拟机混合型、受限沙盒环境型、工作流API集成型 浏览器方案覆盖广但速度慢 沙盒高效但联网受限 工作流精准但业务范围窄 [17][18][22] - ChatGPT Agent采用"浏览器+沙盒虚拟机"架构 在Browsing Camp基准测试中得分50+ 远超同类20+水平 其Deep Research模块能生成详尽报告 [11][13][29] 主流Agent产品对比 - Manus以虚拟机+浏览器构建万能环境 但受限于浏览器操作精度 执行速度慢至30分钟/任务 虚拟机部署优于ChatGPT [26][29] - Genspark采用模板化垂直Agent策略 将通用任务拆解为幻灯片、表格等细分工具 速度优于浏览器方案但功能受限 [31][32] - Pokee通过第三方SDK集成实现4-10倍速度优势 调用成本降低50%-60% 但仅支持专业用户和企业账户操作 [33][35][37] 行业生态与商业模式变革 - Agent将重构互联网流量入口 传统网页搜索行为可能被Agent直接调用API替代 门户网站流量面临下降风险 [46][48] - 广告模式转向知识产权付费 Agent调用内容需向创作者直接付费 推荐系统从排名展示转向连续交互优化 [53][54][59] - 协议标准争夺成关键 谷歌A2A与MCP协议竞争激烈 Pokee自建协议规避MCP可用性差问题 目标降低企业接入门槛 [49][51] 技术路径选择逻辑 - 浏览器方案适合非标C端场景(如旅行规划) 沙盒方案适合数据分析等离线任务 工作流方案适合企业级标准化流程 [17][44] - 专业用户倾向高效工具 Pokee等B端产品聚焦重复性工作流 普通消费者更依赖浏览器型Agent的灵活性 [41][42] - 虚拟机能力决定Agent上限 开放沙盒环境支持自定义程序包下载 受限沙盒依赖预设工具库 [24][26]