文章核心观点 - Clawdbot(现改名为 OpenClaw) 的核心创新在于其持久、本地化且完全由用户掌控的记忆管理系统,该系统通过纯Markdown文件存储,并利用混合搜索技术实现高效的信息检索,旨在提供透明、低成本且无边界的AI智能体交互体验 [1][3][56] Clawdbot 记忆系统的定义与架构 - 上下文是模型在单次请求中看到的所有信息,包括系统提示词、对话历史、工具结果和附件,具有转瞬即逝、有边界和昂贵的特点 [8] - 记忆是持久存储在硬盘上的信息,包括 MEMORY.md、memory/*.md 文件和会话实录,具有持久、无边界、便宜和可搜索的特点 [8] - 记忆系统由两个专门工具管理:memory_search 用于在所有文件中查找相关记忆,memory_get 用于读取找到的具体内容 [9][11] - 记忆写入没有专用工具,AI智能体使用标准文件操作工具,写入位置由 AGENTS.md 中的提示词控制,例如日常笔记写入 memory/YYYY-MM-DD.md,持久事实写入 MEMORY.md [12][14] Clawdbot 记忆系统的运作机制 - 采用双层记忆存储结构:第一层是“只增不减”的每日日志 (memory/YYYY-MM-DD.md),第二层是精选的长期知识库 (MEMORY.md) [16][17] - 记忆索引结合了 sqlite-vec 扩展的向量相似度搜索和 SQLite 自带的 FTS5 全文搜索引擎,实现轻量级的“语义+关键字”混合搜索 [20][21][22] - 记忆搜索并行执行向量搜索和 BM25 关键字搜索,结果按权重(默认向量占70%,文本占30%)合并打分,低于默认阈值0.35的结果被过滤 [23][24][25] - 支持多智能体,每个智能体的记忆通过 agentId + workspaceDir 完全隔离,默认无法访问彼此记忆,适用于区分不同场景(如私人 vs 工作) [26][27][28][34] Clawdbot 的上下文管理策略 - 采用压缩技术应对上下文窗口上限(如 Claude 的 200K Token 或 GPT-5.1 的 1M Token),将旧对话总结为精简条目并保留最近消息 [36][38] - 压缩分自动(接近上下文长度限制时触发)和手动(使用 /compact 命令)两种,压缩后的摘要会存入硬盘上的会话转录文件 [39] - 在压缩前会执行“记忆刷新”,将相关记忆写入文件,防止重要信息在压缩过程中丢失 [41] - 采用剪枝技术移除旧的、庞大的工具输出结果以节省上下文空间,这是一个有损过程,但硬盘上的原始完整文件保持不变 [42][43] - 实施 Cache-TTL 剪枝,在 Anthropic 的提示词前缀缓存(TTL约5分钟)过期后,自动剪除旧的工具结果,以降低重新缓存整个对话历史的高达90%的成本 [44][46][49][50] - 会话生命周期可配置,默认模式为每日重置,也可设置为闲置超时后重置或组合模式,为记忆创造自然边界 [51][53]
Clawdbot 如何搭建永久记忆管理系统:全靠 MD 文档
Founder Park·2026-02-02 19:58