| 主题 | 课程安排 | 
                                 
                                  | 第一部分: 
                                    RAG技术概述 | RAG技术概述 加载器和分割器
 文本嵌入和 向量存储
 如何生成和存储Embedding
 检索器和多文档联合检索
 RAG技术的关键挑战
 检索增强生成实践
 RAG技术文档预处理过程
 RAG技术文档检索过程
 | 
                                 
                                  | 第二部分: 
                                    RAG的架构和核心组件 | RAG架构 文档的导入和解析
 文档的分块
 文本块的嵌入
 向量数据库的选择
 文本块的检索
 回答的生成
 案例实践- 如何快速搭建RAG系统
 使用框架:LangChain的RAG实现
 使用低代码平台coze、Dify、智谱构建RAG
 | 
                                 
                                  | 第三部分: 
                                    企业私有知识的数据导入 | 用数据加载器读取 LangChain中的数据加载器
 用LangChain读取目录中的所有文件
 用LlamaIndex读取目录中的所有文档
 用LlamaHub连接Reader并读取数据库条目
 用Unstructured工具读取各种类型的文档
 读取图片中的文字
 读取PPT中的文字
 用大模型整体解析图文
 网页文档的爬取和解析
 PDF文件的文本格式、布局识别及表格解析
 PDF文件加载工具概述
 案例分析
 | 
                                 
                                  | 第四部分: 
                                    RAG核心技术-文本切块 | RAG场景下的提示词和文本切片 文本切块
 固定大小文本切块
 特殊格式文本切块
 基于深度学习模型的文本
 不同的分块策略
 递归分块
 带滑动窗口的句子切分
 分块时混合生成父子文本块
 分块时为文本块创建元数据
 在分块时形成有级别的索引
 | 
                                 
                                  | 第五部分: 
                                    嵌入(Embedding)向量和向量数据库基础 | 嵌入Embedding核心概念 嵌入是对外部信息的编码
 句子嵌入模型和SentenceTransformers框架
 图像和音频嵌入模型
 大模型时代的嵌入模型
 什么是向量
 向量间的相似度
 相似度应用案例
 为什么需要向量数据库
 向量数据和传统数据的差异
 数据库核心原理
 向量数据库
 | 
                                 
                                  | 第六部分: 
                                    RAG查询检索前处理 | 查询检索构建 Text-to-SQL——自然语言到SQL的转换
 Text-to-Cypher——从自然语言到图数据库查询
 Self-query Retriever——自动从查询中生成元数据过滤条件
 查询翻译——更好地阐释用户问题
 查询重写——将原始问题重构为合适的形式
 查询分解——将查询拆分成多个子问题
 查询澄清——逐步细化和明确用户的问题
 查询扩展——利用HyDE生成假设文档
 查询路由——找到正确的数据源
 逻辑路由——决定查询的路径
 语义路由——选择相关的提示词
 | 
                                 
                                  | 第七部分: 
                                    RAG Prompt技术和响应生成 | Prompt 
                                    提示词工程 RAG与Prompt 提示词优化
 使用Prompt模板
 更改默认的Prompt模板
 更改Prompt模板的变量
 提示词 RAG 大模型交互的效果
 通过改进提示词来提高模型输出质量
 通过输出解析来控制生成内容的格式
 通过选择大模型来提高输出质量
 生成过程中的检索结果集成方式
 Self-RAG
 | 
                                 
                                  | 第八部分: 
                                    索引优化和检索后处理 | 从小到大:节点-句子滑动窗口和父子文本块 节点-句子滑动窗口检索
 利用IndexNode和RecursiveRetriever构建从摘要到细节的索
 分层合并:HierarchicalNodeParser和RAPTOR
 前后串联:通过前向/后向扩展链接相关节点
 混合检索:提高检索*性和扩大覆盖范围
 混合查询和查询路由
 检索 重排
 检索压缩
 检索 校正
 | 
                                 
                                  | 第九部分: 
                                    基于LangChain构建RAG文档问答系统 | 构建复杂LangChain 
                                    RAG 应⽤ LangChain模型(Models):从不同的 LLM 和嵌入模型中进行选择
 LangChain提示(Prompts):管理 LLM 输入
 LangChain链(Chains):将 LLM 与其他组件相结合
 LangChain索引(Indexs):访问外部数据
 LangChain记忆(Memory):记住以前的对话
 LangChain代理(Agents):访问其他工具
 使⽤大模型构建RAG文档问答系统
 | 
                                 
                                  | 第十部分: 
                                    评估RAG应用 | 为什么RAG应用需要评估 RAG应用的评估依据与指标
 RAG应用的评估流程与方法
 评估检索质量
 生成检索评估数据集
 运行评估检索过程的程序
 评估响应质量
 生成响应评估数据集
 单次响应评估
 批量响应评估
 基于自定义标准的评估
 RAG评估案例
 | 
                                 
                                  | 第十一部分: 
                                    RAG实战案例1-企业文档问答系统 | 企业文档问答需求分析与系统设计 确定问答系统的需求:识别用户的主要查询类型与目标
 系统结构与模块划分:明确检索与生成模块的协作方式
 搭建向量数据库与检索模块
 数据预处理与向量化:生成高效的嵌入向量
 构建与优化索引:提升检索模块的查询速度
 生成模块的集成与模型调优
 加载与配置生成模型:选择适合问答系统的生成模型
 模型优化与提示词调优:提高生成内容的准确性与相关性
 RAG系统测试、部署与优化
 测试流程与性能监控:确保系统的稳定性与响应速度
 企业环境的部署与上线:实现系统在实际业务中的应用
 | 
                                 
                                  | 第十二部分: 
                                    RAG实战案例2-医疗文献检索与分析系统 | 医疗文献 
                                    需求分析与数据准备 确定医学文献检索需求:识别用户查询重点
 数据收集与清洗:构建高质量的医学知识库
 构建高效的检索模块
 设计向量检索系统:提升检索效率
 优化索引结构:加速医学文献的精确匹配
 生成模块开发、集成和调优
 生成模型与检索的集成:精准回答用户提问
 生成内容的优化与提示词调优:提升回答的质量与专业性
 | 
                                 
                                  | 第十三部分: 
                                    RAG实战案例3- 法律法规查询助手的开发 | 法律法规需求分析与数据收集 用户需求解析:明确法律法规查询的主要需求
 法律法规数据源与收集方法:搭建全面的法规数据库
 数据清洗与标准化:提升查询效率和准确性
 法律法规检索模块的实现
 向量化法律条款:构建检索友好的嵌入
 FAISS索引在法规查询中的应用:提升检索性能
 优化检索流程:提高法律条款的匹配精度
 生成模块开发与输出优化
 生成模型与检索模块的集成:构建准确的法规回答
 输出格式与内容优化:提供清晰的法律解释
 提示词调优与模型配置:确保法律回答的专业性
 | 
                                 
                                  | 第十四部分: 
                                    企业建设知识库的最佳实践 | 企业级RAG应用的常见优化策略 选择合适的知识块大小
 评估知识块大小
 分离检索阶段的知识块与生成阶段的知识块
 常见的分离策略及实现
 优化对大文档集知识库的检索
 元数据过滤 + 向量检索
 摘要检索+ 内容检索
 多文档Agentic RAG
 使用高级检索方法
 构建端到端的企业级RAG应用
 对生产型RAG应用的主要考量
 端到端的企业级RAG应用架构
 数据存储层
 AI模型层
 RAG工作流与API模块
 端到端的全栈RAG应用案例
 简单的全栈RAG查询应用
 基于多文档Agent的端到端对话应用
 | 
                                 
                                  | 第十五部分: 
                                    RAG 的未来演进 | 多模态RAG的技术进展和发展路线 未来的RAG和Agent如何发展
 如何构建企业级的RAG和Agent集群架构
 GraphRAG:RAG和知识图谱的整合
 上下文检索:突破传统RAG的上下文困境
 ModularRAG:从固定流程到灵活架构的跃迁
 AgenticRAG:自主代理驱动的RAG系统
 Multi-Modal RAG:多模态检索增强生成技术
 |