季逸超亲述 Manus 构建之谜，一文读懂 AI 智能体的上下文工程

上下文工程的核心观点 - Manus团队选择基于上下文工程而非端到端训练构建AI Agent，将产品迭代周期从数周缩短至几小时，保持与底层模型发展的正交性[2][3] - 上下文工程是实验科学，团队通过四次重构Agent框架总结出"随机研究生下降"方法论，即通过手动调试提示词和经验猜测寻找局部最优解[3] - KV缓存命中率是生产级AI Agent最关键指标，直接影响延迟和成本，优化后可使Claude Sonnet模型输入token成本从3美元/百万降至0.3美元/百万[5][8] KV缓存优化策略 - 保持提示词前缀稳定性，避免在系统提示开头插入时间戳等可变元素导致后续缓存失效[13] - 采用只增不减的上下文管理策略，确保序列化过程确定性，避免JSON键顺序变化破坏缓存[13] - 明确标记缓存断点，在系统提示后设置断点以适配不支持自动增量缓存的推理框架[13] 操作空间管理 - 避免动态增删工具定义，工具变更会导致后续所有动作和观察结果的KV缓存失效[12] - 采用感知上下文的状态机进行logits掩码，而非直接移除工具，防止模型产生格式错误输出[15] - 设计统一工具名前缀（如browser_/shell_），便于在特定状态下强制选择某类工具[18] 外部上下文设计 - 将文件系统作为无限容量的外部记忆，训练模型按需读写文件实现结构化存储[23] - 采用可恢复的压缩策略，保留URL或文件路径等关键信息而非永久删除内容[26] - 状态空间模型若掌握基于文件的记忆能力，可能催生新型高效Agent架构[26] 注意力与错误管理 - 通过复述机制（如todo.md文件）将核心目标持续写入上下文末端，防止50次工具调用链中的目标漂移[27][31] - 保留失败尝试和错误信息在上下文中，使模型能隐式更新内部认知降低重复错误概率[35] - 错误恢复能力是衡量Agent智能的关键指标，但被多数基准测试低估[35] 少样本提示优化 - 少样本提示可能导致行为定式，如在简历审查任务中机械重复相似操作[36] - 通过引入序列化模板变体、调整措辞等增加多样性打破思维定式[37] - 上下文同质化会加剧Agent脆弱性，需保持受控随机性激活模型注意力[38]