Workflow
对话蚂蚁 AWorld 庄晨熠:Workflow 不是“伪智能体”,而是 Agent 的里程碑
AI科技大本营·2025-10-28 14:41

文章核心观点 - AI行业当前陷入追求榜单分数的"应试狂热",真正的智能体技术必须超越考试逻辑,走向解决现实世界复杂问题的"实干" [2][7] - 智能体赛道存在泡沫,许多产品仅是传统工作流自动化的"套壳",但Workflow是智能体发展过程中的重要里程碑,而非终点 [3][10] - 群体智能被视为一条可能实现"弯道超车"的路径,其与基础大模型训练是螺旋上升的相辅相成关系,而非替代 [16][18][20] - 真正的智能体具备动态适应和问题解决能力,其核心标志是能够自主"绕路"应对意外情况,而非僵化执行预设流程 [23][24] - 开源是推动AI技术发展和建立行业生态的关键力量,代码背后的认知共享比代码本身更具价值 [32][33][35] 智能体技术与Workflow的关系 - 行业存在对智能体的质疑,认为其仅是Workflow自动化脚本的包装,即"智能体洗白",导致用户体验后迅速流失 [3] - 大模型的出现是分水岭,用基于概率的语义理解替代了过去难以维护的、僵化的手写规则图 [9] - Workflow被视为智能体发展前期的成熟技术阶段和必经的里程碑,但智能体终将超越Workflow [10] - 根本性转变在于从遵循固定标准作业程序的过程导向,演进为以最终结果好坏为评判标准的结果导向 [13] - 真智能体的标志是动态适应能力,例如在工具调用失败后能自主寻找替代方案(如自己写代码),而非像Workflow那样流程中断 [23][24] 群体智能与模型发展的战略路径 - 面对大模型军备竞赛的资源消耗,群体智能提供了一种"弯道超车"的非对称战略思路 [16] - 群体智能的核心是构建协同框架,使多个相对较小的智能体像专家团队一样合作,完成复杂任务 [17] - 群体智能与基础大模型训练是相辅相成、螺旋上升的关系:群体智能系统作为"数据工厂"产生的高质量数据可反哺基础模型,增强其推理能力;更强的基础模型又能提升群体智能中单个智能体的能力 [18][19][20] - 通用智能体与基础模型的边界相对模糊,智能体团队的核心价值在于完成技术到商业价值的"最后一公里",包括必要的模型后训练(post-train)和工程落地 [21][22] 智能体与真实世界的交互演进 - 智能体影响真实世界的三种介质包括:通过自然语言与人交互、通过API交互、以及通过GUI(图形用户界面)交互 [25] - API方式当前最主流但脆弱,依赖提供方且难以泛化;GUI方式模拟人类自然操作,泛化性和扩展性潜力最高,但实现难度也最大 [25][26][27] - 行业需要建立智能体间的通信与协作标准协议(如MCP、A2A),其最终形态可能由大公司推动或因其好用而形成稳定生态 [28] 开源策略与行业生态建设 - 开源是应对AI技术快速迭代、保持领先的关键方法论,其力量体现在集体智慧能加速AI发展,迅速缩小与闭源模型的差距 [32][33] - 开源项目超越代码本身,其核心价值在于共享背后的技术认知和设计哲学,接受检验并激发共创,是极佳的技术"名片" [35][37] - 智能体技术的硬性标准是"自己做出来的智能体自己能用",强调实际应用价值而非空谈 [38] 智能体技术的未来方向 - 未来智能体的关键挑战是完成"长程任务",即像独立个体一样7x24小时运行,处理持续数小时甚至更久的复杂任务,这将引出超长上下文管理、记忆等核心技术难题 [39] - 公司对智能体的未来规划聚焦于两点:一是让智能体在多种环境(如GAIA、IMO)中学习并沉淀经验至模型;二是将智能体作为开放的技术产品,让社区优先享受到技术红利 [40]