行业技术趋势 - 2026年初,全球AI圈集体押注“大模型记忆”技术,将其视为技术风口和皇冠明珠[3] - 几乎所有主流大模型团队都在积极为模型增加记忆功能[4] - 行业共识认为,智能发展已进入比拼长期记忆的下半场,长期记忆是下一代AI应具备的核心能力[69] 现有技术瓶颈与方案 - 当前基于Transformer架构的大模型受限于有限的上下文窗口和物理内存,存在记忆断裂问题,长文本信息会被截断遗忘[14][17] - 随着对话变长,KV Cache占用显存膨胀,影响推理效率,现有技术压缩旧记忆会导致细节模糊[17] - 学术界提出三种主要技术方案:基于外部存储的记忆(如RAG)、基于模型参数的记忆(如DeepSeek所用)、基于隐状态的记忆[19][22][23] - 业界广泛使用的RAG方案存在明显缺点:破坏信息连贯性、时序匹配不足、知识更新成本高昂[26] EverMind公司及其产品EverMemOS - EverMind是由陈天桥和邓亚峰带领的团队[5] - 公司最新发布了世界级长期记忆系统EverMemOS,发布即达到SOTA(State-of-the-Art)水平[6] - EverMemOS项目于2025年8月正式启动,同年11月发布开源版本,从立项到开源仅用时四个月[11][30] - 产品定位为AI记忆基础设施,旨在成为通向下一代人工智能的基础设施——长期记忆系统(Long Term Memory OS)[31][67] EverMemOS的技术原理与特点 - 技术路径独特,融合了基于外部存储和基于隐状态两种记忆方案[33] - 核心思路是“生物启发”,模拟人类大脑的记忆机制[36] - 记忆处理分为三阶段:1) 情景轨迹构建(对应海马体和内嗅皮层),将对话拆分为记忆单元(MemCell);2) 语义整合(对应新皮层),将相关记忆单元归类形成主题化记忆场景(MemScene)并更新用户画像;3) 重构式回忆(对应前额叶与海马体协同),进行智能检索[38][39][40][41] - 系统赋予智能体一个活的、不断演化的历史,实现认知系统的深度整合,并能在多个Agent间高效传递信息[34][41] - 产品设计直接挑战最难的多对多协作场景,而非基础的1v1人机对话[66] EverMemOS的性能表现 - 在多个主流记忆基准测试中全面超越现有记忆系统和全上下文模型[44] - 在GPT-4o-mini模型基础上测试:在Single Hop任务准确率达91.08%(较基线提升13.4%),Multi Hop任务达86.17%(提升119.7%),Temporal任务达81.93%(提升110.0%),Open Domain任务达66.67%(提升10.0%),整体准确率(Overall)达86.76%(提升17.0%)[45] - 在GPT-4.1-mini模型基础上测试:整体准确率(Overall)达93.05%(提升19.2%),其中Multi Hop任务准确率达91.84%(提升112.1%),Temporal任务达89.72%(提升116.1%)[45] - 在多会话对话评估LongMemEval中,以83%的准确率位居榜首[46] - 在操作级幻觉评估基准HaluMem上,显著改善了幻觉现象[46] - 在PersonaMem v2的九个复杂场景中保持最佳,保证了深度个性化和行为一致性[47] - 系统运行速度快、成本低,最长可突破百兆上下文限制[49] 产品化与生态建设 - 公司采取开源与云服务并行的策略,技术代码全部开源,并上线了EverMemOS Cloud云服务[10][52] - 云服务提供简单API调用,可实现记忆摄入、记忆检索、记忆搜索、对话元数据管理等功能[53][55][56] - 公司联手OpenAI等十多个技术社区发起“首届记忆起源大赛(Memory Genesis Competition 2026)”,总奖金池高达8万美元[12][63] - 大赛分为三大赛道:1) 记忆+智能体(奖金5000美元/人,共5名);2) 平台插件(奖金3000美元/人,共7名);3) 操作系统基础设施(奖金3000美元/人,共3名),另设总冠军(额外1万美元)等特别奖项[61][62][63] - 比赛旨在扩大技术影响力、吸纳人才、反哺研发,并构建覆盖应用层、中间层、基础设施的可循环应用生态[67] 公司战略与行业定位 - EverMind由盛大孵化,公司试图用EverMemOS重新定义大模型记忆的技术路线[66][73] - 公司不满足于成为RAG工具或向量数据库,志在成为大模型记忆的书写者,定义记忆的创建、组织、检索和演化方式[67][68] - 公司已开始构造一整套混合解决方案,底层是信息处理模块,上层在强化学习驱动下通过调用模型参数使用信息[66] - 在模型能力同质化背景下,高性能记忆系统被视为智能体拉开差距、留住用户的护城河[70] - 公司借鉴盛大在互联网时代的平台生态经验,旨在成为AI记忆生态的缔造者[72]
陈天桥邓亚峰联手破解大模型记忆难题!4个月打造SOTA系统,悬赏8万美元发起全球记忆挑战赛
量子位·2026-02-05 14:01