第17章安全与可靠性

Agent 拥有了工具和自主性，安全问题就变得尤为重要。这一章是从"能用"到"敢用"的关键。

本章概览

Agent 的安全与可靠性涉及五个方面：Prompt 注入防御、幻觉控制、权限管理、数据保护和行为对齐。本章逐一讲解每个方面的原理和实用防御方案。

本章目标

✅ 理解 Prompt 注入的原理和防御策略
✅ 掌握减少幻觉、提高事实性的技术
✅ 设计最小权限体系和代码执行沙箱
✅ 实现敏感数据的检测和脱敏
✅ 构建行为边界和拒绝策略

本章结构

小节	内容
17.1 Prompt 注入攻击与防御	攻击手法、多层防御
17.2 幻觉问题与事实性保障	引用验证、RAG核查
17.3 权限控制与沙箱隔离	最小权限、代码沙箱
17.4 敏感数据保护	PII检测、数据脱敏
17.5 Agent 行为的可控性与对齐	行为边界、拒绝策略

⏱️ 预计学习时间

约 90-120 分钟

💡 前置知识

已完成第 16 章（评估与优化）
了解常见的 Web 安全概念（如注入攻击）会有帮助

🔗 学习路径

前置知识：第16章评估与优化

后续推荐：

👉 第18章部署与生产化 — 在部署中实践安全策略

👉 第19-21章综合项目 — 在实战项目中应用安全实践

下一节：17.1 Prompt 注入攻击与防御