Workflow
工作流+工具集成
icon
搜索文档
OpenAI杀入通用AI Agent的背后:四大技术流派与下一个万亿流量之战
36氪· 2025-08-03 17:57
OpenAI发布ChatGPT Agent进军通用AI Agent赛道 - 7月17日OpenAI正式发布ChatGPT Agent 融合Deep Research(搜索)和Operator(执行)两大工具 实现"搜索与执行"一体化能力 [1][4] - 技术路线基于浏览器控制 通过视觉模型模拟人类网页操作 通用性强但速度慢 任务耗时可达几十分钟 [7][9][12] - 发布当日ChatGPT日指令量达25亿条 年化9125亿次 相当于谷歌年搜索量的18% [48] 通用AI Agent四大技术流派对比 浏览器为主派(OpenAI) - 优势:全网访问 通用性极强 视觉模型和浏览器点击能力领先行业 [9][13] - 劣势:需加载完整HTML和脚本 Token消耗高 速度慢成为主要痛点 [10][12] 虚拟机+浏览器派(Manus) - 沙盒虚拟机提供隔离计算环境 可本地执行复杂操作 结合浏览器增强功能 [14][16] - 4月融资7500万美元 估值5亿美元 但受限于浏览器能力 页面导航等精细操作困难 [20][22] 大模型+虚拟机派(GensPark) - 限制性沙盒环境搭配预置工具 通过API直接调用服务 牺牲通用性换取速度 [24][26] - A轮融资1亿美元 估值5.3亿美元 集成80多个预构建工具 标准化工作流提升可靠性 [28][31] 工作流+工具集成派(Pokee/UiPath) - 预设节点调用第三方应用 速度达行业4-10倍 工具调用成本降低50%-60% [32][34] - 强化学习自动规划流程 但局限于特定场景 通用性不足 [33] 未来流量入口与商业模式变革 - Agent交互将产生"幽灵光标"现象 取代人类成为互联网访问主力 门户网站流量面临断崖式下跌 [39][41][42] - Google推出Agent2Agent协议争夺入口标准 内容付费模式可能取代广告分成 [42][46] - 创作者可通过API直接收费 广告嵌入Agent工作流环节 商业生态面临重构 [46]