AI Agent 上下文工程 通过复述操控注意力 AI Agent 上下文工程前些天发现了一个巨牛的人工智能学习网站,分享一下给大家目录AI Agent 上下文工程一、围绕 KV 缓存进行设计核心原理关键实践反例 vs 正例二、遮蔽,而非移除核心原理三种约束模式反例 vs 正例三、使用文件系统作为上下文核心原理关键思想反例 vs 正例四、通过复述操控注意力核心原理Manus 的经典实现反例 vs 正例五、保留错误的内容核心原理反例 vs 正例六、不要被少样本示例所困核心原理反例 vs 正例Manus 团队基于数百万用户实践总结的 AI Agent 上下文工程六大核心原则,以下是详细解析:一、围绕 KV 缓存进行设计核心原理KV-Cache(键值缓存)命中率是生产级 AI Agent 最重要的单一指标,直接影响延迟和成本。Agent 运行时输入输出 token 比例约为 100:1,利用缓存可将成本降低 10 倍(如 Claude Sonnet:缓存 token $0.3/百万 vs 未缓存 $3/百万)。关键实践保持提示前缀稳定:避免在系统提示中加入秒级时间戳上下文只追加不修改:确保 JSON 序列化键顺序稳定明确标记缓存断点反例 vs 正例❌错误做法:每轮都重新构建完整上下文,导致缓存完全失效第n轮: [指令+动作1+观察1+动作2+观察2+动作3+观察3] 第n+1轮: [指令+动作2+观察2+动作3+观察3+动作4+观察4] (前缀完全变化)✅