国内外AI大厂重押，初创梭哈，谁能凭「记忆」成为下一个「DeepSeek」？

大模型记忆能力的重要性 - 记忆能力成为AI技术演进的关键方向是提升AI智能的核心让AI能够持续学习积累经验适应新任务而不遗忘旧知识同时实现长上下文的高效理解[2] - 当前大模型依靠长文本和外部数据库的记忆属于"短期记忆" 而业界追求的是具备人类记忆组织、检索、应用方式的"长期记忆"或"终身记忆"[3] - 2024年8月成为记忆功能集中发布期 Anthropic在8月12日让Claude具有记忆功能谷歌13日宣布Gemini配备记忆能力字节跳动14日发布具备长期记忆的M3-Agent系统 OpenAI在20日将记忆作为GPT-6重点[4] 行业参与者布局情况 - OpenAI早在2023年2月就在ChatGPT上线记忆功能马斯克的xAI在2024年4月宣称Grok能记住多轮对话 Mistral AI最新宣布引入记忆系统并与20多个企业平台集成[5][6] - 记忆张量是聚焦Agent Memory的初创企业推出了业界首个记忆操作系统其团队成员参与研发的记忆分层大模型Memory³在2024年7月发布[9] - 腾讯AI Lab是业界最早进行利用RAG提升模型记忆能力的研究团队之一相关研究曾获得2021年ACL杰出论文奖[14] 技术发展驱动力 - 技术侧驱动力来自Scaling Law边际效应下降通过堆算力、参数量获得性能提升的效果明显下降即便再去堆成倍算力都拿不到10%甚至5%的能力突破[20] - 应用侧需求来自AI Agent发展用户希望AI能作为合作伙伴解决长期问题需要记住之前的交互与反馈模型终身记忆成为非常重要的事情[21][22] - 记忆能力是Agent取得突破性进展的必不可少环节技术侧和应用侧形成双重诉求[7][23] 技术路线分析 - 参数化记忆路线基于基座模型架构驱动融合记忆创新让模型从参数层面区分需要被记忆的内容在推理过程中融合到前向推理过程[26] - 上下文记忆路线将信息以prompt方式放在Context Window中典型代表Manus不断强调在Agent交互过程中做KV cache管理[28] - 外部数据库/RAG路线将信息存储在模型外部数据库中通过RAG将相关内容取回注入到当前Context Window[28] - 各种路线都有优势与局限性参数化记忆理论上限高但研发成本高上下文记忆容易变成纯粹工程事情 RAG上限较低[27][28][29] 市场格局与商业模式 - 第一类玩家是OpenAI、Anthropic、Google等AI厂商通过引入长短期记忆能力达成个性化服务目标借助记忆的个性化能力来留住用户[33] - 第二类玩家是记忆中间件服务商如Mem0、记忆张量的MemOS、Zep等开源记忆框架面向更广泛开发者提供记忆能力增强[33] - Mistral AI宣布免费扩展企业级业务平台Le Chat 已与20多家平台集成试图通过提供先进记忆功能打破AI市场竞争格局[35] 发展时间框架 - 距离真正能够大范围应用记忆能力让用户感受到生活无处不在变化还需要一到两年时间[36] - 要达到解决记忆幻觉问题、隐私保障和立法等治理层面至少还需要三到五年时间[37] - 记忆能力竞赛中各类玩家互相角力战况胶着谁都有可能突破未来乾坤未定一切皆有可能是黑马[38]