第7章 上下文工程
📖 "提示工程让你学会如何跟 LLM 说话,上下文工程让你学会如何帮 LLM 看见全世界。"
📌 与第8章的关系:本章聚焦上下文的内容和策略(窗口管理、信息密度、注意力预算);第8章 Harness 工程则关注工程规范和执行结构(Agents.md、六大工程支柱)。两章是互补而非重复,建议连续阅读。
🎓 学习目标
完成本章学习后,你将能够:
- ✅ 理解从 Prompt Engineering 到 Context Engineering 的范式转变
- ✅ 掌握上下文窗口管理和注意力预算分配技巧
- ✅ 设计适合长时程任务的上下文保留策略
- ✅ 构建一个实用的上下文管理器工具库
- ✅ 了解 2025—2026 年上下文工程的最新进展
⏱️ 预计学习时间
约 75-90 分钟
💡 前置知识
- 完成第2章(LLM 基础)、第4章(记忆系统)和第6章(RAG)
- 理解 Token 计算和 Embedding 的基本原理
🔗 学习路径
后续推荐:
本章概览
如果说 Prompt Engineering 是"如何提一个好问题",那么 Context Engineering(上下文工程) 就是"如何为 LLM 构建一个高质量的信息环境"。
随着 Agent 承担的任务越来越复杂——从简单的问答到跨越数百轮交互的长时程任务——单纯优化 prompt 已经远远不够。你需要系统性地管理 LLM 在每次推理时能看到的全部信息:对话历史、工具返回、检索文档、任务状态……这些信息的总量可能轻松超过 100K tokens,而上下文窗口是有限的。
这是 Agent 开发中最容易被忽视、但对实际效果影响最大的主题之一。Anthropic CEO Dario Amodei 曾明确表示:"我更愿意称之为上下文工程,而不仅仅是提示工程" [1]。掌握上下文工程,是从"能写 prompt"到"能构建生产级 Agent"的关键跨越。
📚 本章结构
| 小节 | 内容 | 核心收获 | 难度 |
|---|---|---|---|
| 7.1 从提示工程到上下文工程 | 定义上下文工程,对比两者差异 | 六大信息源模型 + 三大设计原则 | ⭐⭐ |
| 7.2 上下文窗口管理与注意力预算 | 上下文腐蚀、注意力分布、管理技术 | 注意力预算分配 + 三种管理技术 | ⭐⭐⭐ |
| 7.3 长时程任务的上下文策略 | 压缩整合、结构化笔记、子代理架构 | 三大策略的原理与组合使用 | ⭐⭐⭐ |
| 7.4 实战:构建上下文管理器 | 完整 GSSC 流水线实现 | 可复用的上下文管理基础设施 | ⭐⭐⭐⭐ |
| 7.5 上下文工程前沿进展 | 长上下文、JIT、结构化输出 | 2025—2026 最新趋势与方向 | ⭐⭐⭐⭐⭐ |
参考文献
[1] AMODEI D. Context engineering vs prompt engineering[EB/OL]. 2025.
下一节:7.1 从提示工程到上下文工程