DeepSeek发布梁文锋署名新论文
财联社·2026-01-13 09:15
论文发布与核心技术创新 - DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》 [1] - 论文由北京大学与DeepSeek共同完成,合著作者署名中出现梁文锋 [1] - 论文提出“条件记忆”新方法,通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型性能 [1] 技术原理与性能提升 - 提出的“条件记忆”技术是大型语言模型稀疏性的一个新维度 [1] - 该技术能在知识调用、推理、代码、数学等任务上显著提升模型表现 [1] 开源与行业影响 - DeepSeek同步开源了相关的记忆模块,命名为Engram [1]