Agent Memory - 财报，业绩电话会，研报，新闻

Agent Memory

搜索文档

Cloudflare 推出 Agent Memory：面向 AI 智能体的持久记忆托管服务

AI前线· 2026-05-11 14:44

Cloudflare Agent Memory服务发布 - Cloudflare在Agents Week期间宣布其AI智能体记忆服务Agent Memory已开启私人测试这是一项托管服务旨在为AI智能体提供跨会话、重启后的持久化记忆能力[2] - 该服务通过从对话中提取结构化记忆仅在需要时检索相关内容避免了将所有信息塞入有限上下文窗口的问题[2] - 公司构建此服务是为了解决平台上实际运行的工作负载所暴露的短板即需要一种能够随规模扩大持续可用的记忆能力而不仅仅是在标准基准数据集上表现良好的记忆[2] 解决的核心行业痛点与架构转变 - Agent Memory服务旨在解决“上下文衰减”问题研究表明即使上下文窗口已突破百万级词元随着上下文被填满模型输出质量会下降[3] - 研究还表明模型在上下文更少但内容更相关的情况下能生成更优质的结果这使得记忆功能成为提升输出质量的重要手段而不仅是存储管理工具[3] - 行业专家指出此次公告标志着智能体系统设计思路的转变记忆“越来越不像是模型的特新更像是基础设施” 生命周期管理、有效性校验、信息压缩与隔离边界成为重要关注点[3] 服务的技术架构细节 - 在数据摄入端每条消息分配一个基于内容寻址的SHA-256标识以实现幂等重复摄入提取器并行运行两条处理通道：一条以约10K字符为单位分块处理另一条专注于名称、价格、版本号等具体数值信息[4] - 验证器在记忆分类前执行八项校验将记忆划分为事实、事件、指令和任务四种类型事实与指令按照归一化主题进行键值管理新增记忆会覆盖旧有记忆[4] - 在检索端五条通道并行运行并通过倒数排名融合整合结果包括全文搜索、精确事实键查找、原始消息搜索、直接向量搜索以及HyDE向量搜索[5] - 公司默认使用Llama 4 Scout完成信息提取与分类工作仅在内容合成时使用Nemotron 3 发现更大的模型仅在合成阶段能发挥作用[5] 服务的差异化优势与功能特点 - 服务提供共享记忆功能突破单智能体记忆局限团队可共用同一份记忆档案共享规范约定、架构决策和隐性知识[8] - 公司的差异化优势在于边缘分布式部署与自身计算原语的深度集成以及独有的多通道检索架构[9] - 行业评测指出服务的“可导出”功能意味着能提取原始事实但并不代表检索流程具备可移植性提取质量取决于开发者无法控制的次级模型[8] - 评测建议对于关键事实应主动调用remember工具而非依赖自动摄入并建议在上下文窗口达到约60%时触发压缩[8] 市场竞争格局 - 智能体记忆赛道正变得拥挤竞争对手包括提供托管云API的Mem0 采用时序知识图谱的Zep Graphiti引擎需要自行部署托管但可与LangGraph集成的LangMem 以及提供分层记忆架构的Letta[9]