Workflow
技能密度
icon
搜索文档
Agent 热潮年度回望:一切火爆早有预兆
36氪· 2026-02-09 16:00
文章核心观点 文章系统回顾了2024年至2025年期间,推动智能体(Agent)从概念热潮走向工业化落地的关键变量。核心观点认为,行业正经历从宏大叙事向务实架构的转变,焦点从追求“像人”的自治转向构建“可长期、稳定、可治理”的系统[30]。这一过程通过协议建设、架构分层、技能网络化、记忆系统完善以及开源模型发展等多个层面的收敛与演进共同实现[4][6][9][18][22][26]。 关键变量总结 01 行业认知的收敛与转向 - Agent经历了从“元年”的宏大叙事(如多智能体社会、AI员工、数字组织结构重构)向应对现实工程挑战的转变[4] - 早期Agent存在执行链条不稳定(“五步不过冈”)、长任务易偏航、权限模糊、成本不可预测等问题,难以融入严肃工作流[3][4] - 行业心态从询问“它像不像个员工?”转向关注“它能不能长期、稳定、可治理地做事?”[30] 02 底层协议的建设与挑战 - 行业出现了为Agent时代建立统一底层协议的系统性尝试,以MCP和A2A为代表[6] - MCP旨在为模型接入工具和数据建立统一接口,A2A则希望实现Agent之间的跨平台协作,常被类比为Agent时代的TCP/IP[7] - 协议建设面临挑战:工具体系复杂多样,商业边界与权限约束各异,且标准版本、厂商立场和实现不一致,导致推广谨慎[7] 03 架构分层:从“认知+执行”到技能(Skill)重构 - Agent形态演变为“认知+执行”的组合体,架构上分为认知层、技能层、连接层和持续层[10] - **认知层**:由大语言模型负责,承担理解意图、拆解任务和规划决策,接受其不确定性[10] - **技能层**:将涉及外部后果的动作(如发邮件、改数据、下单)封装为可复用、可治理的执行单元(Skill),确保输入输出清晰、权限明确、可重试、可审计[10][17] - **连接层**:负责将技能连接到外部世界(如数据库、SaaS系统)[10] - **持续层**:负责管理任务状态与长期记忆,保障连续性[10] - 与API的区别在于控制权迁移:API时代组合逻辑由程序员写在代码中,Skill架构下组合逻辑由模型在运行时规划,实现了从“程序员写流程”到“模型生成流程”的转变[15][17] 04 技能(Skill)密度与网络效应 - 当模型能力进入同一量级后,竞争焦点从“谁更聪明”转向“谁背后站着更多真实可用的技能”[19] - 技能价值呈网络化增长:技能模块化后,新增一个技能不仅增加一种用途,更创造出多种组合可能,技能密度越高,系统的“解题维度”越多[19] - 生态发展的关键不再是技能数量,而是技能的流动性,即能否被检索、被不同模型规划、跨系统复用,从而形成网络效应[20] - 当前Agent生态类似移动互联网早期,尚未出现大规模第三方能力市场、稳定的技能商店或形成网络效应的爆款应用[21] 05 记忆(Memory)系统与任务持续性 - 记忆是保障任务连续性的关键,使Agent从一次性推理工具转变为持续存在的系统[22] - 记忆系统包含三层结构:**任务状态**(实现断点续跑)、**长期语境**(存储用户偏好、组织约束等)、**行为轨迹与决策历史**(积累行动模式)[24] - 长上下文、RAG与持久记忆是不同概念:长上下文扩展单次推理的注意力范围;RAG解决外部信息检索;持久记忆则实现跨时间、跨任务的背景继承与经验积累[23] - 记忆系统使Agent具备组织价值,但其发展仍面临成本、更新与遗忘机制不成熟,以及错误或偏见被固化的风险[25] 06 开源大模型的角色与影响 - 中国开源大模型(如千问、Kimi、Step)在过去一年取得显著跃迁,频繁进入开发者的真实工作流[26] - 以阶跃星辰的Step 3.5 Flash模型为例,其采用稀疏混合专家结构,总参数1960亿,每次激活约110亿参数,注重效率与结构[26] - 开源模型的技术改进(如混合注意力机制、多token并行预测)恰好对应了Agent时代对更长上下文、更低延迟、更稳定逻辑执行的核心需求[27] - 本地部署能力(如256K上下文模型可在128GB内存的MacBook上运行)改变了权力结构,实现了“终端平权”,并满足了医疗、金融等垂直行业对可控、可部署基座的需求[29]