技能密度 - 财报，业绩电话会，研报，新闻

技能密度

搜索文档

36氪· 2026-02-09 16:00

文章核心观点文章系统回顾了2024年至2025年期间，推动智能体（Agent）从概念热潮走向工业化落地的关键变量。核心观点认为，行业正经历从宏大叙事向务实架构的转变，焦点从追求“像人”的自治转向构建“可长期、稳定、可治理”的系统[30]。这一过程通过协议建设、架构分层、技能网络化、记忆系统完善以及开源模型发展等多个层面的收敛与演进共同实现[4][6][9][18][22][26]。关键变量总结 01 行业认知的收敛与转向 - Agent经历了从“元年”的宏大叙事（如多智能体社会、AI员工、数字组织结构重构）向应对现实工程挑战的转变[4] - 早期Agent存在执行链条不稳定（“五步不过冈”）、长任务易偏航、权限模糊、成本不可预测等问题，难以融入严肃工作流[3][4] - 行业心态从询问“它像不像个员工？”转向关注“它能不能长期、稳定、可治理地做事？”[30] 02 底层协议的建设与挑战 - 行业出现了为Agent时代建立统一底层协议的系统性尝试，以MCP和A2A为代表[6] - MCP旨在为模型接入工具和数据建立统一接口，A2A则希望实现Agent之间的跨平台协作，常被类比为Agent时代的TCP/IP[7] - 协议建设面临挑战：工具体系复杂多样，商业边界与权限约束各异，且标准版本、厂商立场和实现不一致，导致推广谨慎[7] 03 架构分层：从“认知+执行”到技能（Skill）重构 - Agent形态演变为“认知+执行”的组合体，架构上分为认知层、技能层、连接层和持续层[10] - **认知层**：由大语言模型负责，承担理解意图、拆解任务和规划决策，接受其不确定性[10] - **技能层**：将涉及外部后果的动作（如发邮件、改数据、下单）封装为可复用、可治理的执行单元（Skill），确保输入输出清晰、权限明确、可重试、可审计[10][17] - **连接层**：负责将技能连接到外部世界（如数据库、SaaS系统）[10] - **持续层**：负责管理任务状态与长期记忆，保障连续性[10] - 与API的区别在于控制权迁移：API时代组合逻辑由程序员写在代码中，Skill架构下组合逻辑由模型在运行时规划，实现了从“程序员写流程”到“模型生成流程”的转变[15][17] 04 技能（Skill）密度与网络效应 - 当模型能力进入同一量级后，竞争焦点从“谁更聪明”转向“谁背后站着更多真实可用的技能”[19] - 技能价值呈网络化增长：技能模块化后，新增一个技能不仅增加一种用途，更创造出多种组合可能，技能密度越高，系统的“解题维度”越多[19] - 生态发展的关键不再是技能数量，而是技能的流动性，即能否被检索、被不同模型规划、跨系统复用，从而形成网络效应[20] - 当前Agent生态类似移动互联网早期，尚未出现大规模第三方能力市场、稳定的技能商店或形成网络效应的爆款应用[21] 05 记忆（Memory）系统与任务持续性 - 记忆是保障任务连续性的关键，使Agent从一次性推理工具转变为持续存在的系统[22] - 记忆系统包含三层结构：**任务状态**（实现断点续跑）、**长期语境**（存储用户偏好、组织约束等）、**行为轨迹与决策历史**（积累行动模式）[24] - 长上下文、RAG与持久记忆是不同概念：长上下文扩展单次推理的注意力范围；RAG解决外部信息检索；持久记忆则实现跨时间、跨任务的背景继承与经验积累[23] - 记忆系统使Agent具备组织价值，但其发展仍面临成本、更新与遗忘机制不成熟，以及错误或偏见被固化的风险[25] 06 开源大模型的角色与影响 - 中国开源大模型（如千问、Kimi、Step）在过去一年取得显著跃迁，频繁进入开发者的真实工作流[26] - 以阶跃星辰的Step 3.5 Flash模型为例，其采用稀疏混合专家结构，总参数1960亿，每次激活约110亿参数，注重效率与结构[26] - 开源模型的技术改进（如混合注意力机制、多token并行预测）恰好对应了Agent时代对更长上下文、更低延迟、更稳定逻辑执行的核心需求[27] - 本地部署能力（如256K上下文模型可在128GB内存的MacBook上运行）改变了权力结构，实现了“终端平权”，并满足了医疗、金融等垂直行业对可控、可部署基座的需求[29]