AI编程节省95% token,工具调用上限狂飙20倍,开源记忆系统登顶GitHub热榜
量子位·2026-02-08 09:40

产品核心定位与价值主张 - 产品Claude-Mem是一款旨在解决AI编程助手“跨会话失忆”痛点的持久化记忆系统,其核心价值在于为Claude Code用户提供长期记忆能力,避免开发者在每次新会话中重复解释项目背景[2][5] - 该产品通过本地搭建记忆系统,自动捕获并存储工具调用记录,并在新会话开始时自动检索和注入相关上下文,实现工作的无缝衔接[6][7][13] - 产品本身100%免费,并通过其架构设计帮助用户显著节省Token使用成本[4] 核心技术架构与工作流程 - 系统采用事件驱动架构,通过五个生命周期钩子在后台静默运行,自动捕获文件读写、代码编辑、命令执行等操作,并存储为“观察记录”[6][7] - 存储方案采用混合路线:使用SQLite配合FTS5进行全文检索,使用Chroma向量数据库进行语义搜索,所有数据均存储在用户本地[9][10] - 在会话结束时,系统会调用Claude Agent SDK将冗长的原始工具使用记录压缩成结构化的精炼摘要,摘要包含调查内容、学习成果、已完成工作、后续步骤等关键模块[11][12] 核心创新:分层检索与成本节省 - 产品最大的亮点是采用“三层渐进式披露”的检索工作流,与传统记忆系统将全部历史记录塞入上下文窗口的做法相反,从而显著节省Token[14][15] - 第一层索引层使用search工具拉取紧凑列表,每条结果约消耗50到100个Token;第二层时间线层获取时序上下文;第三层才批量获取完整细节,单条成本在500到1000 Token之间[16] - 在此分层策略下,一个原本需要20000 Token才能完整加载的上下文,经过筛选后可能只需3000 Token就能获取所有必要信息,且相关度为100%[18] - 测试阶段的“无尽模式”更为激进,能将工具输出实时压缩成约500 Token的观察记录,使Token节省率达到95%,同时工具调用次数上限提升了约20倍[4][19][20] 用户体验与附加功能 - 产品内置mem-search技能,支持使用自然语言查询项目历史[22] - 提供本地Web界面,供用户实时查看记忆流、会话摘要,并可在稳定版与Beta版之间切换配置[23] - 在隐私控制方面,用户可通过标签阻止敏感信息被记录,新版本引入了双标签系统以提供更细粒度的控制[25] - 安装流程简便,通过Claude Code插件市场,仅需两条命令和一次重启即可完成,无需复杂环境配置[26]