Agent Memory
搜索文档
Cloudflare 推出 Agent Memory:面向 AI 智能体的持久记忆托管服务
AI前线· 2026-05-11 14:44
Cloudflare Agent Memory服务发布 - Cloudflare在Agents Week期间宣布其AI智能体记忆服务Agent Memory已开启私人测试 这是一项托管服务 旨在为AI智能体提供跨会话、重启后的持久化记忆能力[2] - 该服务通过从对话中提取结构化记忆 仅在需要时检索相关内容 避免了将所有信息塞入有限上下文窗口的问题[2] - 公司构建此服务是为了解决平台上实际运行的工作负载所暴露的短板 即需要一种能够随规模扩大持续可用的记忆能力 而不仅仅是在标准基准数据集上表现良好的记忆[2] 解决的核心行业痛点与架构转变 - Agent Memory服务旨在解决“上下文衰减”问题 研究表明即使上下文窗口已突破百万级词元 随着上下文被填满 模型输出质量会下降[3] - 研究还表明 模型在上下文更少但内容更相关的情况下能生成更优质的结果 这使得记忆功能成为提升输出质量的重要手段 而不仅是存储管理工具[3] - 行业专家指出 此次公告标志着智能体系统设计思路的转变 记忆“越来越不像是模型的特新 更像是基础设施” 生命周期管理、有效性校验、信息压缩与隔离边界成为重要关注点[3] 服务的技术架构细节 - 在数据摄入端 每条消息分配一个基于内容寻址的SHA-256标识以实现幂等重复摄入 提取器并行运行两条处理通道:一条以约10K字符为单位分块处理 另一条专注于名称、价格、版本号等具体数值信息[4] - 验证器在记忆分类前执行八项校验 将记忆划分为事实、事件、指令和任务四种类型 事实与指令按照归一化主题进行键值管理 新增记忆会覆盖旧有记忆[4] - 在检索端 五条通道并行运行并通过倒数排名融合整合结果 包括全文搜索、精确事实键查找、原始消息搜索、直接向量搜索以及HyDE向量搜索[5] - 公司默认使用Llama 4 Scout完成信息提取与分类工作 仅在内容合成时使用Nemotron 3 发现更大的模型仅在合成阶段能发挥作用[5] 服务的差异化优势与功能特点 - 服务提供共享记忆功能 突破单智能体记忆局限 团队可共用同一份记忆档案 共享规范约定、架构决策和隐性知识[8] - 公司的差异化优势在于边缘分布式部署 与自身计算原语的深度集成 以及独有的多通道检索架构[9] - 行业评测指出 服务的“可导出”功能意味着能提取原始事实 但并不代表检索流程具备可移植性 提取质量取决于开发者无法控制的次级模型[8] - 评测建议对于关键事实应主动调用remember工具而非依赖自动摄入 并建议在上下文窗口达到约60%时触发压缩[8] 市场竞争格局 - 智能体记忆赛道正变得拥挤 竞争对手包括提供托管云API的Mem0 采用时序知识图谱的Zep Graphiti引擎 需要自行部署托管但可与LangGraph集成的LangMem 以及提供分层记忆架构的Letta[9]