第7章 检索增强生成(RAG)
📚 "RAG 是解决 LLM 知识局限性的最实用方案——让 Agent 能够'查阅'外部知识库,给出有依据的回答。"
本章概览
RAG(Retrieval-Augmented Generation,检索增强生成)是当前最重要的 AI 应用技术之一。LLM 的知识有截止日期,而且无法访问你的私有数据。RAG 通过"先检索、再生成"的方式,让 Agent 能够基于最新的、特定领域的知识来回答问题。本章从原理到实战,全面讲解如何构建 RAG 系统。
本章目标
学完本章,你将能够:
- ✅ 理解 RAG 的核心原理和工作流程
- ✅ 掌握文档加载和文本分割的最佳实践
- ✅ 使用向量嵌入和向量数据库进行语义检索
- ✅ 运用混合检索、重排序等策略提升检索质量
- ✅ 构建一个完整的智能文档问答 Agent
本章结构
| 小节 | 内容 | 难度 |
|---|---|---|
| 7.1 RAG 的概念与工作原理 | 为什么需要 RAG?如何工作? | ⭐⭐ |
| 7.2 文档加载与文本分割 | 处理各种格式的文档 | ⭐⭐ |
| 7.3 向量嵌入与向量数据库 | 语义存储与检索 | ⭐⭐⭐ |
| 7.4 检索策略与重排序 | 提升检索精准度 | ⭐⭐⭐ |
| 7.5 实战:智能文档问答 Agent | 完整系统实现 | ⭐⭐⭐⭐ |
⏱️ 预计学习时间
约 90-120 分钟(含实战练习)
💡 前置知识
- 已完成第 5 章(记忆系统)中向量数据库的基础概念
- 了解 Python 文件操作和 HTTP 请求
- 对 OpenAI Embeddings API 有基本了解
🔗 学习路径
前置知识:第5章 记忆系统(尤其是向量数据库部分)
后续推荐:
- 👉 第8章 上下文工程 — 系统化管理 RAG 检索到的上下文信息
- 👉 第19章 AI 编程助手 — 在实战项目中运用 RAG 做代码搜索
下一节:7.1 RAG 的概念与工作原理