| 主题 |
课程安排 |
| 第一部分:
RAG技术概述 |
RAG技术概述
加载器和分割器
文本嵌入和 向量存储
如何生成和存储Embedding
检索器和多文档联合检索
RAG技术的关键挑战
检索增强生成实践
RAG技术文档预处理过程
RAG技术文档检索过程 |
| 第二部分:
RAG的架构和核心组件 |
RAG架构
文档的导入和解析
文档的分块
文本块的嵌入
向量数据库的选择
文本块的检索
回答的生成
案例实践- 如何快速搭建RAG系统
使用框架:LangChain的RAG实现
使用低代码平台coze、Dify、智谱构建RAG |
| 第三部分:
企业私有知识的数据导入 |
用数据加载器读取
LangChain中的数据加载器
用LangChain读取目录中的所有文件
用LlamaIndex读取目录中的所有文档
用LlamaHub连接Reader并读取数据库条目
用Unstructured工具读取各种类型的文档
读取图片中的文字
读取PPT中的文字
用大模型整体解析图文
网页文档的爬取和解析
PDF文件的文本格式、布局识别及表格解析
PDF文件加载工具概述
案例分析 |
| 第四部分:
RAG核心技术-文本切块 |
RAG场景下的提示词和文本切片
文本切块
固定大小文本切块
特殊格式文本切块
基于深度学习模型的文本
不同的分块策略
递归分块
带滑动窗口的句子切分
分块时混合生成父子文本块
分块时为文本块创建元数据
在分块时形成有级别的索引 |
| 第五部分:
嵌入(Embedding)向量和向量数据库基础 |
嵌入Embedding核心概念
嵌入是对外部信息的编码
句子嵌入模型和SentenceTransformers框架
图像和音频嵌入模型
大模型时代的嵌入模型
什么是向量
向量间的相似度
相似度应用案例
为什么需要向量数据库
向量数据和传统数据的差异
数据库核心原理
向量数据库 |
| 第六部分:
RAG查询检索前处理 |
查询检索构建
Text-to-SQL——自然语言到SQL的转换
Text-to-Cypher——从自然语言到图数据库查询
Self-query Retriever——自动从查询中生成元数据过滤条件
查询翻译——更好地阐释用户问题
查询重写——将原始问题重构为合适的形式
查询分解——将查询拆分成多个子问题
查询澄清——逐步细化和明确用户的问题
查询扩展——利用HyDE生成假设文档
查询路由——找到正确的数据源
逻辑路由——决定查询的路径
语义路由——选择相关的提示词 |
| 第七部分:
RAG Prompt技术和响应生成 |
Prompt
提示词工程
RAG与Prompt 提示词优化
使用Prompt模板
更改默认的Prompt模板
更改Prompt模板的变量
提示词 RAG 大模型交互的效果
通过改进提示词来提高模型输出质量
通过输出解析来控制生成内容的格式
通过选择大模型来提高输出质量
生成过程中的检索结果集成方式
Self-RAG |
| 第八部分:
索引优化和检索后处理 |
从小到大:节点-句子滑动窗口和父子文本块
节点-句子滑动窗口检索
利用IndexNode和RecursiveRetriever构建从摘要到细节的索
分层合并:HierarchicalNodeParser和RAPTOR
前后串联:通过前向/后向扩展链接相关节点
混合检索:提高检索*性和扩大覆盖范围
混合查询和查询路由
检索 重排
检索压缩
检索 校正 |
| 第九部分:
基于LangChain构建RAG文档问答系统 |
构建复杂LangChain
RAG 应⽤
LangChain模型(Models):从不同的 LLM 和嵌入模型中进行选择
LangChain提示(Prompts):管理 LLM 输入
LangChain链(Chains):将 LLM 与其他组件相结合
LangChain索引(Indexs):访问外部数据
LangChain记忆(Memory):记住以前的对话
LangChain代理(Agents):访问其他工具
使⽤大模型构建RAG文档问答系统 |
| 第十部分:
评估RAG应用 |
为什么RAG应用需要评估
RAG应用的评估依据与指标
RAG应用的评估流程与方法
评估检索质量
生成检索评估数据集
运行评估检索过程的程序
评估响应质量
生成响应评估数据集
单次响应评估
批量响应评估
基于自定义标准的评估
RAG评估案例 |
| 第十一部分:
RAG实战案例1-企业文档问答系统 |
企业文档问答需求分析与系统设计
确定问答系统的需求:识别用户的主要查询类型与目标
系统结构与模块划分:明确检索与生成模块的协作方式
搭建向量数据库与检索模块
数据预处理与向量化:生成高效的嵌入向量
构建与优化索引:提升检索模块的查询速度
生成模块的集成与模型调优
加载与配置生成模型:选择适合问答系统的生成模型
模型优化与提示词调优:提高生成内容的准确性与相关性
RAG系统测试、部署与优化
测试流程与性能监控:确保系统的稳定性与响应速度
企业环境的部署与上线:实现系统在实际业务中的应用 |
| 第十二部分:
RAG实战案例2-医疗文献检索与分析系统 |
医疗文献
需求分析与数据准备
确定医学文献检索需求:识别用户查询重点
数据收集与清洗:构建高质量的医学知识库
构建高效的检索模块
设计向量检索系统:提升检索效率
优化索引结构:加速医学文献的精确匹配
生成模块开发、集成和调优
生成模型与检索的集成:精准回答用户提问
生成内容的优化与提示词调优:提升回答的质量与专业性 |
| 第十三部分:
RAG实战案例3- 法律法规查询助手的开发 |
法律法规需求分析与数据收集
用户需求解析:明确法律法规查询的主要需求
法律法规数据源与收集方法:搭建全面的法规数据库
数据清洗与标准化:提升查询效率和准确性
法律法规检索模块的实现
向量化法律条款:构建检索友好的嵌入
FAISS索引在法规查询中的应用:提升检索性能
优化检索流程:提高法律条款的匹配精度
生成模块开发与输出优化
生成模型与检索模块的集成:构建准确的法规回答
输出格式与内容优化:提供清晰的法律解释
提示词调优与模型配置:确保法律回答的专业性 |
| 第十四部分:
企业建设知识库的最佳实践 |
企业级RAG应用的常见优化策略
选择合适的知识块大小
评估知识块大小
分离检索阶段的知识块与生成阶段的知识块
常见的分离策略及实现
优化对大文档集知识库的检索
元数据过滤 + 向量检索
摘要检索+ 内容检索
多文档Agentic RAG
使用高级检索方法
构建端到端的企业级RAG应用
对生产型RAG应用的主要考量
端到端的企业级RAG应用架构
数据存储层
AI模型层
RAG工作流与API模块
端到端的全栈RAG应用案例
简单的全栈RAG查询应用
基于多文档Agent的端到端对话应用 |
| 第十五部分:
RAG 的未来演进 |
多模态RAG的技术进展和发展路线
未来的RAG和Agent如何发展
如何构建企业级的RAG和Agent集群架构
GraphRAG:RAG和知识图谱的整合
上下文检索:突破传统RAG的上下文困境
ModularRAG:从固定流程到灵活架构的跃迁
AgenticRAG:自主代理驱动的RAG系统
Multi-Modal RAG:多模态检索增强生成技术 |