KV缓存 - 财报，业绩电话会，研报，新闻 - Reportify

KV缓存

搜索文档

来自 Manus 的一手分享：如何构建 AI Agent 的上下文工程？

Founder Park· 2025-07-19 02:51

技术路线选择 - 公司选择基于上下文工程而非端到端模型训练，实现几小时内发布改进而非数周迭代[3] - 历史教训显示自研模型易被前沿技术颠覆，如GPT-3与Flan-T5使早期开放信息抽取模型失效[3] - 采用"随机梯度下降"方法四次重构智能体框架，通过手动架构搜索优化上下文塑造[4] KV缓存优化 - KV缓存命中率是核心指标，Claude Sonnet缓存/未缓存的token成本相差10倍（0.3 vs 3美元/百万token）[6][7] - 智能体输入输出token比例达100:1，需保持提示前缀稳定、上下文追加式更新、标记缓存断点提升效率[6][11] - 动态增删工具会破坏KV缓存，应通过上下文感知状态机屏蔽logits而非移除工具[10][12] 上下文管理策略 - 将文件系统作为外化记忆，支持按需读写解决128K上下文窗口限制，保留URL/路径实现可还原压缩[17][19][23] - 通过复述机制（如todo.md文件）操控模型注意力，50次工具调用任务中避免目标偏离[24][27] - 保留错误内容可提升智能体适应性，失败行动记录能降低重复错误概率[28][31] 提示工程实践 - 少样本提示需引入结构化变化防止模式固化，动作/观察序列采用不同模板打破重复性[32] - 函数调用支持Auto/Required/Specified三种模式，通过统一工具前缀实现状态无关约束[15][20] - 上下文工程决定智能体行为边界，需平衡模型原生能力与环境反馈[33][34]

上下文工程

Artificial Intelligence

上下文工程

Artificial Intelligence