全球软件-生成式 AI ：深入解析智能体技术-Global Software_ Generative AI 401_ Agents (under the hood)

AI Agentic Systems 行业研究报告关键要点涉及的行业与公司 * 行业：全球软件行业，特别是生成式人工智能（Gen AI）的应用层和平台即服务（PaaS）层[8]。 * 覆盖的上市公司：Adobe (ADBE), HubSpot (HUBS), Microsoft (MSFT), MongoDB (MDB), Oracle (ORCL), Salesforce.com (CRM), SAP (SAP), Snowflake (SNOW), Workday (WDAY)[6]。 * 提及的AI产品/公司：Claude Code/Cowork (Anthropic), OpenAI Codex/Agent Builder, OpenClaw[1][13]。核心观点与论据 1. AI Agents 的定义与定位 * AI Agents 构建在基础大语言模型之上，旨在解决基础LLM的缺陷，如无法记忆、信息陈旧、无法执行操作和频繁幻觉[2]。 * 通过为LLM提供记忆、领域知识、上下文、数据、工具、规则和指南，Agentic AI 弥补了这些缺陷[2][16]。 * AI Agents 很可能成为AI软件技术栈应用层的重要组成部分，而LLM和Agentic开发工具将成为PaaS层的一部分[8]。 2. 工作原理与核心组件 * 核心机制：通过向LLM的输入（上下文窗口）提供完成任务所需的所有信息，包括用户信息、业务背景、步骤分解、所需工具及使用方式、相关数据等[3][17]。 * 组件化：由于上下文窗口空间有限，工程师将上下文解析为不同模块以优化组织，主要包括短期记忆、长期记忆、工具以及规则/工作流/技能[4][18]。 * 关键组件详解： * 短期记忆：通过保留运行历史记录来解决LLM无法记住对话历史的问题，并使用总结性LLM压缩令牌以节省上下文空间[21][49]。 * 长期记忆：通过RAG或Agent检索等机制，让LLM访问其训练数据之外的知识（如企业专有数据）[21][57]。 * 工具：使LLM能够执行对话之外的操作，通过工具模式（如JSON格式）将自然语言指令转化为可执行代码[21][73]。 * MCP：模型上下文协议，为LLM与第三方应用交互提供标准化方式，是工具生态繁荣的关键[21][84]。 * 规则/工作流/技能：通过逻辑指令进一步约束LLM的非确定性，在灵活性和一致性之间取得平衡[21][108]。 3. 行业发展趋势与关键观察 * 发展范式转变：从在LLM内部构建转向围绕LLM构建；从通用方法转向更专业化的方法以提升任务性能[5]。 * 创新节奏：构建Agent所需的大量设计和工程选择表明，阶跃式突破可能比预训练扩展时代需要更长的时间[5][26]。 * 确定性 vs. 非确定性：为每种工作流程找到确定性（一致性）和非确定性（灵活性）之间的完美平衡，是释放新用例的关键[6][32]。这是一个从完全自由到完全确定的连续光谱[112][116]。 * 实施复杂性：建立一个优秀的Agent，尤其是其生态系统，需要大量复杂工作，包括数据质量、流程清洁度、员工适应意愿等，发展时间线可能比许多人想象的更长[6][32]。 4. 技术挑战与限制 * 长上下文挑战：受限于上下文窗口长度限制和LLM在长上下文下的性能衰减[32][48]。 * 多Agent系统：更复杂的任务需要分解并由多个Agent协作完成，这会使未解决的问题成倍增加[32]。 * 数据基础设施：为Agent提供上下文需要大量的基础工作，包括数据的收集、清理、预处理和索引[60][61]。 * 检索机制：RAG和Agent检索各有优劣，未来可能共存。RAG具有确定性，而Agent检索更具灵活性但可能增加推理令牌[62][65]。投资启示与潜在影响 1. 对软件公司的影响 * 拥有客户数据和领域专业知识是应用软件公司的关键优势[8]。 * 许多覆盖范围内的公司正在提供/加强其“数据云”类产品，以帮助客户为采用Agent做好准备[10]。 2. 对计算基础设施的影响 * 与纯LLM计算（训练和推理）主要基于GPU不同，许多Agent步骤将在CPU上执行[9][26]。 * 随着Agentic AI采用率提高，应看到CPU消耗增加，这对超大规模云服务商（如Microsoft, Oracle）是可能的顺风，将推动AI工作负载的额外收入和更高的毛利率[9][27]。 3. 对数据基础设施的影响 * Agent将使用更多数据，为云数据库供应商（如Microsoft, Oracle, MongoDB, Snowflake）带来增量顺风[10]。 * 构建有效的Agent需要在数据基础设施方面进行大量基础工作[10]。 4. 对人才需求的影响 * 构建Agent的复杂性推动了对高级顾问和“前向部署工程师”的需求[11][32]。其他重要内容 * 模型改进 vs. 能力释放：Agent能力的提升不一定意味着模型本身的改进。Agent架构是围绕LLM构建的，有助于释放现有LLM的潜力[26]。 * 当前产品状态：与2022年的版本相比，如今的ChatGPT及其竞争对手已经整合了许多Agentic功能来增强基础LLM的能力[34]。 * ReAct框架：通过将任务分解为具体步骤并使用工具来增强知识，在此类框架下的Agent能够生成更基于事实和确定性输出的答案，从而减少幻觉[101][104]。