AI Agentic Systems 行业研究报告关键要点 涉及的行业与公司 * 行业:全球软件行业,特别是生成式人工智能(Gen AI)的应用层和平台即服务(PaaS)层[8]。 * 覆盖的上市公司:Adobe (ADBE), HubSpot (HUBS), Microsoft (MSFT), MongoDB (MDB), Oracle (ORCL), Salesforce.com (CRM), SAP (SAP), Snowflake (SNOW), Workday (WDAY)[6]。 * 提及的AI产品/公司:Claude Code/Cowork (Anthropic), OpenAI Codex/Agent Builder, OpenClaw[1][13]。 核心观点与论据 1. AI Agents 的定义与定位 * AI Agents 构建在基础大语言模型之上,旨在解决基础LLM的缺陷,如无法记忆、信息陈旧、无法执行操作和频繁幻觉[2]。 * 通过为LLM提供记忆、领域知识、上下文、数据、工具、规则和指南,Agentic AI 弥补了这些缺陷[2][16]。 * AI Agents 很可能成为AI软件技术栈应用层的重要组成部分,而LLM和Agentic开发工具将成为PaaS层的一部分[8]。 2. 工作原理与核心组件 * 核心机制:通过向LLM的输入(上下文窗口)提供完成任务所需的所有信息,包括用户信息、业务背景、步骤分解、所需工具及使用方式、相关数据等[3][17]。 * 组件化:由于上下文窗口空间有限,工程师将上下文解析为不同模块以优化组织,主要包括短期记忆、长期记忆、工具以及规则/工作流/技能[4][18]。 * 关键组件详解: * 短期记忆:通过保留运行历史记录来解决LLM无法记住对话历史的问题,并使用总结性LLM压缩令牌以节省上下文空间[21][49]。 * 长期记忆:通过RAG或Agent检索等机制,让LLM访问其训练数据之外的知识(如企业专有数据)[21][57]。 * 工具:使LLM能够执行对话之外的操作,通过工具模式(如JSON格式)将自然语言指令转化为可执行代码[21][73]。 * MCP:模型上下文协议,为LLM与第三方应用交互提供标准化方式,是工具生态繁荣的关键[21][84]。 * 规则/工作流/技能:通过逻辑指令进一步约束LLM的非确定性,在灵活性和一致性之间取得平衡[21][108]。 3. 行业发展趋势与关键观察 * 发展范式转变:从在LLM内部构建转向围绕LLM构建;从通用方法转向更专业化的方法以提升任务性能[5]。 * 创新节奏:构建Agent所需的大量设计和工程选择表明,阶跃式突破可能比预训练扩展时代需要更长的时间[5][26]。 * 确定性 vs. 非确定性:为每种工作流程找到确定性(一致性)和非确定性(灵活性)之间的完美平衡,是释放新用例的关键[6][32]。这是一个从完全自由到完全确定的连续光谱[112][116]。 * 实施复杂性:建立一个优秀的Agent,尤其是其生态系统,需要大量复杂工作,包括数据质量、流程清洁度、员工适应意愿等,发展时间线可能比许多人想象的更长[6][32]。 4. 技术挑战与限制 * 长上下文挑战:受限于上下文窗口长度限制和LLM在长上下文下的性能衰减[32][48]。 * 多Agent系统:更复杂的任务需要分解并由多个Agent协作完成,这会使未解决的问题成倍增加[32]。 * 数据基础设施:为Agent提供上下文需要大量的基础工作,包括数据的收集、清理、预处理和索引[60][61]。 * 检索机制:RAG和Agent检索各有优劣,未来可能共存。RAG具有确定性,而Agent检索更具灵活性但可能增加推理令牌[62][65]。 投资启示与潜在影响 1. 对软件公司的影响 * 拥有客户数据和领域专业知识是应用软件公司的关键优势[8]。 * 许多覆盖范围内的公司正在提供/加强其“数据云”类产品,以帮助客户为采用Agent做好准备[10]。 2. 对计算基础设施的影响 * 与纯LLM计算(训练和推理)主要基于GPU不同,许多Agent步骤将在CPU上执行[9][26]。 * 随着Agentic AI采用率提高,应看到CPU消耗增加,这对超大规模云服务商(如Microsoft, Oracle)是可能的顺风,将推动AI工作负载的额外收入和更高的毛利率[9][27]。 3. 对数据基础设施的影响 * Agent将使用更多数据,为云数据库供应商(如Microsoft, Oracle, MongoDB, Snowflake)带来增量顺风[10]。 * 构建有效的Agent需要在数据基础设施方面进行大量基础工作[10]。 4. 对人才需求的影响 * 构建Agent的复杂性推动了对高级顾问和“前向部署工程师”的需求[11][32]。 其他重要内容 * 模型改进 vs. 能力释放:Agent能力的提升不一定意味着模型本身的改进。Agent架构是围绕LLM构建的,有助于释放现有LLM的潜力[26]。 * 当前产品状态:与2022年的版本相比,如今的ChatGPT及其竞争对手已经整合了许多Agentic功能来增强基础LLM的能力[34]。 * ReAct框架:通过将任务分解为具体步骤并使用工具来增强知识,在此类框架下的Agent能够生成更基于事实和确定性输出的答案,从而减少幻觉[101][104]。
全球软件-生成式 AI :深入解析智能体技术-Global Software_ Generative AI 401_ Agents (under the hood)