AI编程节省95% token，工具调用上限狂飙20倍，开源记忆系统登顶GitHub热榜

产品核心定位与价值主张 - 产品Claude-Mem是一款旨在解决AI编程助手“跨会话失忆”痛点的持久化记忆系统，其核心价值在于为Claude Code用户提供长期记忆能力，避免开发者在每次新会话中重复解释项目背景[2][5] - 该产品通过本地搭建记忆系统，自动捕获并存储工具调用记录，并在新会话开始时自动检索和注入相关上下文，实现工作的无缝衔接[6][7][13] - 产品本身100%免费，并通过其架构设计帮助用户显著节省Token使用成本[4] 核心技术架构与工作流程 - 系统采用事件驱动架构，通过五个生命周期钩子在后台静默运行，自动捕获文件读写、代码编辑、命令执行等操作，并存储为“观察记录”[6][7] - 存储方案采用混合路线：使用SQLite配合FTS5进行全文检索，使用Chroma向量数据库进行语义搜索，所有数据均存储在用户本地[9][10] - 在会话结束时，系统会调用Claude Agent SDK将冗长的原始工具使用记录压缩成结构化的精炼摘要，摘要包含调查内容、学习成果、已完成工作、后续步骤等关键模块[11][12] 核心创新：分层检索与成本节省 - 产品最大的亮点是采用“三层渐进式披露”的检索工作流，与传统记忆系统将全部历史记录塞入上下文窗口的做法相反，从而显著节省Token[14][15] - 第一层索引层使用search工具拉取紧凑列表，每条结果约消耗50到100个Token；第二层时间线层获取时序上下文；第三层才批量获取完整细节，单条成本在500到1000 Token之间[16] - 在此分层策略下，一个原本需要20000 Token才能完整加载的上下文，经过筛选后可能只需3000 Token就能获取所有必要信息，且相关度为100%[18] - 测试阶段的“无尽模式”更为激进，能将工具输出实时压缩成约500 Token的观察记录，使Token节省率达到95%，同时工具调用次数上限提升了约20倍[4][19][20] 用户体验与附加功能 - 产品内置mem-search技能，支持使用自然语言查询项目历史[22] - 提供本地Web界面，供用户实时查看记忆流、会话摘要，并可在稳定版与Beta版之间切换配置[23] - 在隐私控制方面，用户可通过标签阻止敏感信息被记录，新版本引入了双标签系统以提供更细粒度的控制[25] - 安装流程简便，通过Claude Code插件市场，仅需两条命令和一次重启即可完成，无需复杂环境配置[26]