RAG 工作流程 — 检索增强生成

1

📄 文档加载与分块 (Chunking)

将长文档切分为语义完整的文本块，每块 200-500 tokens，相邻块有 10-20% 重叠

2

🔢 向量化 (Embedding)

通过 Embedding 模型将每个文本块转为高维向量（如 1536 维），语义相近的文本在向量空间中距离更近

3

🔍 查询向量化 + 相似度搜索

用户问题: "Python 在 AI 领域有什么应用？" → 向量化 → 在向量空间中找最近的 Top-K 个块

4

🧩 Prompt 组装

将检索到的文本块注入 System Prompt，构建完整的增强上下文

[System] 你是一个专业助手，请基于以下参考资料回答问题。

[Context] Chunk 3: "Python 在人工智能领域应用广泛，包括机器学习（TensorFlow, PyTorch）、自然语言处理（Transformers）、计算机视觉（OpenCV）..."
Chunk 7: "Python 的 scikit-learn 库提供了丰富的传统 ML 算法..."

[User] Python 在 AI 领域有什么应用？

5

🤖 LLM 生成回答

大模型基于增强上下文生成回答，确保内容有据可依、减少幻觉

📚 RAG 工作流程：从文档到精准回答