Workflow
强化学习+大模型记忆:Mem-α,让智能体第一次学会“如何记忆”
机器之心·2025-11-07 15:17

在大语言模型快速发展的今天, " 记忆 " 正成为智能体能否真正具备长期智能的关键。 即使是支持百万级上下文的 GPT-4.1,当交互持续增长时,成本和延迟依然会呈指数级上升。于是, 外部记忆系统应运而生——然而,大多数现有方案依赖人工规则与 prompt 指令,模型并不真正"理 解"何时该记、记什么、如何更新。 Mem-α 的出现,正是为了解决这一困境。由加州大学圣地亚哥分校的 Yu Wang 在 Anuttacon 实习 期间完成,这项工作是首次将强化学习引入大模型的记忆管理体系,让模型能够自主学习如何使用工具 去存储、更新和组织记忆。 论文标题: Mem-α: Learning Memory Construction via Reinforcement Learning 论文链接: https://arxiv.org/abs/2509.25911 代码仓库: https://github.com/wangyu-ustc/Mem-alpha 开源模型: https://huggingface.co/YuWangX/Memalpha-4B 训练数据集: https://huggingface.co/data ...