第7章检索增强生成（RAG）

📚 "RAG 是解决 LLM 知识局限性的最实用方案——让 Agent 能够'查阅'外部知识库，给出有依据的回答。"

本章概览

RAG（Retrieval-Augmented Generation，检索增强生成）是当前最重要的 AI 应用技术之一。LLM 的知识有截止日期，而且无法访问你的私有数据。RAG 通过"先检索、再生成"的方式，让 Agent 能够基于最新的、特定领域的知识来回答问题。本章从原理到实战，全面讲解如何构建 RAG 系统。

本章目标

学完本章，你将能够：

✅ 理解 RAG 的核心原理和工作流程
✅ 掌握文档加载和文本分割的最佳实践
✅ 使用向量嵌入和向量数据库进行语义检索
✅ 运用混合检索、重排序等策略提升检索质量
✅ 构建一个完整的智能文档问答 Agent

本章结构

小节	内容	难度
7.1 RAG 的概念与工作原理	为什么需要 RAG？如何工作？	⭐⭐
7.2 文档加载与文本分割	处理各种格式的文档	⭐⭐
7.3 向量嵌入与向量数据库	语义存储与检索	⭐⭐⭐
7.4 检索策略与重排序	提升检索精准度	⭐⭐⭐
7.5 实战：智能文档问答 Agent	完整系统实现	⭐⭐⭐⭐

⏱️ 预计学习时间

约 90-120 分钟（含实战练习）

💡 前置知识

已完成第 5 章（记忆系统）中向量数据库的基础概念
了解 Python 文件操作和 HTTP 请求
对 OpenAI Embeddings API 有基本了解

🔗 学习路径

前置知识：第5章记忆系统（尤其是向量数据库部分）

后续推荐：

👉 第8章上下文工程 — 系统化管理 RAG 检索到的上下文信息

👉 第19章 AI 编程助手 — 在实战项目中运用 RAG 做代码搜索

下一节：7.1 RAG 的概念与工作原理

从零开始学 Agent

第7章 检索增强生成（RAG）

本章概览

本章目标

本章结构

⏱️ 预计学习时间

💡 前置知识

🔗 学习路径

第7章检索增强生成（RAG）