第7章 检索增强生成(RAG)

📚 "RAG 是解决 LLM 知识局限性的最实用方案——让 Agent 能够'查阅'外部知识库,给出有依据的回答。"


本章概览

RAG(Retrieval-Augmented Generation,检索增强生成)是当前最重要的 AI 应用技术之一。LLM 的知识有截止日期,而且无法访问你的私有数据。RAG 通过"先检索、再生成"的方式,让 Agent 能够基于最新的、特定领域的知识来回答问题。本章从原理到实战,全面讲解如何构建 RAG 系统。

本章目标

学完本章,你将能够:

  • ✅ 理解 RAG 的核心原理和工作流程
  • ✅ 掌握文档加载和文本分割的最佳实践
  • ✅ 使用向量嵌入和向量数据库进行语义检索
  • ✅ 运用混合检索、重排序等策略提升检索质量
  • ✅ 构建一个完整的智能文档问答 Agent

本章结构

小节内容难度
7.1 RAG 的概念与工作原理为什么需要 RAG?如何工作?⭐⭐
7.2 文档加载与文本分割处理各种格式的文档⭐⭐
7.3 向量嵌入与向量数据库语义存储与检索⭐⭐⭐
7.4 检索策略与重排序提升检索精准度⭐⭐⭐
7.5 实战:智能文档问答 Agent完整系统实现⭐⭐⭐⭐

⏱️ 预计学习时间

90-120 分钟(含实战练习)

💡 前置知识

  • 已完成第 5 章(记忆系统)中向量数据库的基础概念
  • 了解 Python 文件操作和 HTTP 请求
  • 对 OpenAI Embeddings API 有基本了解

🔗 学习路径

前置知识第5章 记忆系统(尤其是向量数据库部分)

后续推荐


下一节:7.1 RAG 的概念与工作原理