📚 RAG 工作流程:从文档到精准回答

检索增强生成 (Retrieval-Augmented Generation) — 完整流水线动画

1
📄 文档加载与分块 (Chunking)
将长文档切分为语义完整的文本块,每块 200-500 tokens,相邻块有 10-20% 重叠
2
🔢 向量化 (Embedding)
通过 Embedding 模型将每个文本块转为高维向量(如 1536 维),语义相近的文本在向量空间中距离更近
3
🔍 查询向量化 + 相似度搜索
用户问题: "Python 在 AI 领域有什么应用?" → 向量化 → 在向量空间中找最近的 Top-K 个块
4
🧩 Prompt 组装
将检索到的文本块注入 System Prompt,构建完整的增强上下文
[System] 你是一个专业助手,请基于以下参考资料回答问题。
[Context] Chunk 3: "Python 在人工智能领域应用广泛,包括机器学习(TensorFlow, PyTorch)、自然语言处理(Transformers)、计算机视觉(OpenCV)..."
Chunk 7: "Python 的 scikit-learn 库提供了丰富的传统 ML 算法..."
[User] Python 在 AI 领域有什么应用?
5
🤖 LLM 生成回答
大模型基于增强上下文生成回答,确保内容有据可依、减少幻觉