参数化记忆 - 财报，业绩电话会，研报，新闻

参数化记忆

搜索文档

机器之心· 2025-08-31 13:33

大模型记忆技术发展现状 - 谷歌Gemini具备跨越多次对话的长期记忆能力，可从用户交流中提炼关键细节和偏好并主动调用[1] - OpenAI的ChatGPT早在2024年2月就已上线记忆功能，使用频率越多记忆力越好，GPT-6的核心改进也将聚焦记忆能力[3] - Anthropic的Claude能记住之前对话，允许用户无缝继续项目并参考之前讨论[3] - xAI的Grok在4月份实现多轮对话记忆，且记忆内容对用户透明可见并可选择遗忘[6] - 字节跳动联合浙大和上交发布多模态智能体M3-Agent，将记忆能力扩展到视频、音频等多模态数据[10] 记忆技术实现方式分类 - 上下文内记忆：将信息放入模型上下文窗口的短期记忆方式，受Transformer有限上下文窗口长度限制[17][18][19] - 外部记忆：通过检索增强生成(RAG)技术将信息存储在外部数据库的长期记忆方式，支持海量信息存储且无需重新训练模型[22][23] - 参数化记忆：将信息直接编码进大模型自身参数的深层"内化记忆"方式，检索速度极快但更新成本高昂[24][29][30] - 类人的分层式记忆：受认知科学启发设计的类似人脑记忆架构，分为记录具体事件的情景记忆和存储一般事实的语义记忆[31][35] 主要公司的记忆技术实现 - ChatGPT记忆功能：将用户记忆以结构化片段保存于服务器端，通过提示工程方式在生成回复时自动注入模型参考语境[42][44] - Claude记忆机制：只在用户要求时检索和引用过去聊天记录，不建立用户档案[44] - Gemini记忆功能：支持用户直接录入想要记住的内容[45] - MemGPT系统：使用专门记忆LLM智能体管理工作LLM上下文窗口，受传统操作系统分层内存系统启发[49][52] 记忆操作系统创新 - MemOS系统：将记忆看作与算力同等重要的系统资源，通过标准化MemCube记忆单元统一调度明文、激活状态和参数记忆[53][55] - MemoryOS系统：融合计算机操作系统原理与人脑分层记忆机制，构建段页式三级存储架构及四大核心模块[55] - MIRIX系统：将记忆细分为核心记忆、情景记忆、语义记忆、程序记忆、资源记忆、知识金库六类进行处理[57][59] 记忆结构化与多模态进展 - G-Memory系统：设计三层图式基于模型(洞察图、查询图和交互图)，支持定制化记忆视角与跨智能体语义映射[66][67][71] - 多模态记忆突破：Memories.ai提出"大视觉记忆模型"(LVMM)，能持续捕获、存储和结构化海量视觉数据[70] - M3-Agent架构：通过强化学习驱动的多轮推理与迭代记忆检索，实现无限信息处理和世界知识构建[70][75][78] 原生记忆能力探索 - Meta记忆层概念：通过键-值对检索机制实现关联存储与调用，记忆容量可达1280亿参数级别[77][80][81] - Branch-Train-MiX方法：通过创建多个专家模型在不同数据子集上训练，然后合并为MoE模块实现参数化记忆[83][92] - Yan 2.0 Preview模型：基于非Transformer架构，通过可微分"神经网络记忆单元"实现记忆的存储、检索和遗忘[85][87] 技术发展趋势 - 从功能模拟到结构仿生：向多模态与综合记忆系统演进，整合不同类型记忆模块形成多层次自适应综合记忆中枢[97][98][106] - 从孤立个体到记忆互联：智能体间实现共享记忆与协作，催生集体智能但面临信息不对称和集体隐私保护挑战[100][101] - 终极目标自动演化：实现记忆的自动演化，智能体能够根据环境互动自主学习管理和优化记忆，实现无需人工干预的终身学习[101][103]