求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center 汽车系统工程   模型库  
会员   
 
 
 
  开班计划 | 认证培训 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导 | 角色培养  
 电话 English
成功案例   品质保证
成功案例
中国电信 大模型核心技术RA
中国船舶 AI大模型辅助软件
某公募基 金融领域的AI大模
某著名通 AI大模型全栈工程
某车企 AI大模型应用实践
某石油天 Python数据挖
某证券企 知识图谱与图数据库

相关课程  
开源大模型推理、训练与部署
深度学习、目标识别强化学习
(知识图谱+图数据库)*大模型
人工智能.机器学习& PyTorch
人工智能+Python+大数据
深度学习入门与实战
知识图谱建模与应用
 
全部课程 >人工智能  
基于AI大模型开发RAG知识库最佳实践
27 次浏览  3 次
Schroeder
微软人工智能认证工程师,阿里云AI人工智能训练师
 
时间地点:北京、上海、 深圳 根据报名开班
课程费用:5000元/人
报公开课  
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    课程简介:

          大型语言模型(LLM)已经取得了显著的成功,尽管它们仍然面临重大的限制,特别是在特定领域或知识密集型任务中,尤其是在处理超出其训练数据或需要当前信息的查询时,常会产生“幻觉”现象。为了克服这些挑战,检索增强生成(RAG)通过从外部知识库检索相关文档chunk并进行语义相似度计算,增强了LLM的功能。通过引用外部知识,RAG有效地减少了生成事实不正确内容的问题。RAG目前是基于LLM系统中最受欢迎的架构,有许多产品基于RAG构建,使RAG成为推动聊天机器人发展和增强LLM在现实世界应用适用性的关键技术。
    培训对象:

    • 各类软件企业和研发中心的程序员、软件设计师、架构师, 项目经理,业务架构师,公司管理者
    • 零基础LLM应用开发者
    学员基础:

         具备基础的Python知识
    授课方式:

         讲师讲授+现场讨论+案例分析+模型讲解
    课程安排:2天

    主题 课程安排
    第一部分: RAG技术概述 RAG技术概述
    加载器和分割器
    文本嵌入和 向量存储
    如何生成和存储Embedding
    检索器和多文档联合检索
    RAG技术的关键挑战
    检索增强生成实践
    RAG技术文档预处理过程
    RAG技术文档检索过程
    第二部分: RAG的架构和核心组件 RAG架构
    文档的导入和解析
    文档的分块
    文本块的嵌入
    向量数据库的选择
    文本块的检索
    回答的生成
    案例实践- 如何快速搭建RAG系统
    使用框架:LangChain的RAG实现
    使用低代码平台coze、Dify、智谱构建RAG
    第三部分: 企业私有知识的数据导入 用数据加载器读取
    LangChain中的数据加载器
    用LangChain读取目录中的所有文件
    用LlamaIndex读取目录中的所有文档
    用LlamaHub连接Reader并读取数据库条目
    用Unstructured工具读取各种类型的文档
    读取图片中的文字
    读取PPT中的文字
    用大模型整体解析图文
    网页文档的爬取和解析
    PDF文件的文本格式、布局识别及表格解析
    PDF文件加载工具概述
    案例分析
    第四部分: RAG核心技术-文本切块 RAG场景下的提示词和文本切片
    文本切块
    固定大小文本切块
    特殊格式文本切块
    基于深度学习模型的文本
    不同的分块策略
    递归分块
    带滑动窗口的句子切分
    分块时混合生成父子文本块
    分块时为文本块创建元数据
    在分块时形成有级别的索引
    第五部分: 嵌入(Embedding)向量和向量数据库基础  嵌入Embedding核心概念
    嵌入是对外部信息的编码
    句子嵌入模型和SentenceTransformers框架
    图像和音频嵌入模型
    大模型时代的嵌入模型
    什么是向量 
    向量间的相似度 
    相似度应用案例 
    为什么需要向量数据库 
    向量数据和传统数据的差异 
    数据库核心原理
    向量数据库
    第六部分: RAG查询检索前处理  查询检索构建
    Text-to-SQL——自然语言到SQL的转换
    Text-to-Cypher——从自然语言到图数据库查询
    Self-query Retriever——自动从查询中生成元数据过滤条件
    查询翻译——更好地阐释用户问题
    查询重写——将原始问题重构为合适的形式
    查询分解——将查询拆分成多个子问题
    查询澄清——逐步细化和明确用户的问题
    查询扩展——利用HyDE生成假设文档
    查询路由——找到正确的数据源
    逻辑路由——决定查询的路径
    语义路由——选择相关的提示词
    第七部分: RAG Prompt技术和响应生成  Prompt 提示词工程
    RAG与Prompt 提示词优化
    使用Prompt模板
    更改默认的Prompt模板
    更改Prompt模板的变量 
    提示词 RAG 大模型交互的效果
    通过改进提示词来提高模型输出质量
    通过输出解析来控制生成内容的格式
    通过选择大模型来提高输出质量
    生成过程中的检索结果集成方式
    Self-RAG
    第八部分: 索引优化和检索后处理  从小到大:节点-句子滑动窗口和父子文本块
    节点-句子滑动窗口检索
    利用IndexNode和RecursiveRetriever构建从摘要到细节的索
    分层合并:HierarchicalNodeParser和RAPTOR
    前后串联:通过前向/后向扩展链接相关节点
    混合检索:提高检索*性和扩大覆盖范围
    混合查询和查询路由
    检索 重排
    检索压缩
    检索 校正 
    第九部分: 基于LangChain构建RAG文档问答系统 构建复杂LangChain RAG 应⽤
    LangChain模型(Models):从不同的 LLM 和嵌入模型中进行选择
    LangChain提示(Prompts):管理 LLM 输入
    LangChain链(Chains):将 LLM 与其他组件相结合
    LangChain索引(Indexs):访问外部数据
    LangChain记忆(Memory):记住以前的对话
    LangChain代理(Agents):访问其他工具
    使⽤大模型构建RAG文档问答系统
    第十部分: 评估RAG应用 为什么RAG应用需要评估
    RAG应用的评估依据与指标
    RAG应用的评估流程与方法
    评估检索质量
    生成检索评估数据集
    运行评估检索过程的程序
    评估响应质量
    生成响应评估数据集
    单次响应评估
    批量响应评估
    基于自定义标准的评估
    RAG评估案例
    第十一部分: RAG实战案例1-企业文档问答系统 企业文档问答需求分析与系统设计
    确定问答系统的需求:识别用户的主要查询类型与目标
    系统结构与模块划分:明确检索与生成模块的协作方式
    搭建向量数据库与检索模块
    数据预处理与向量化:生成高效的嵌入向量
    构建与优化索引:提升检索模块的查询速度
    生成模块的集成与模型调优
    加载与配置生成模型:选择适合问答系统的生成模型
    模型优化与提示词调优:提高生成内容的准确性与相关性
    RAG系统测试、部署与优化
    测试流程与性能监控:确保系统的稳定性与响应速度
    企业环境的部署与上线:实现系统在实际业务中的应用
    第十二部分: RAG实战案例2-医疗文献检索与分析系统 医疗文献 需求分析与数据准备
    确定医学文献检索需求:识别用户查询重点
    数据收集与清洗:构建高质量的医学知识库
    构建高效的检索模块
    设计向量检索系统:提升检索效率
    优化索引结构:加速医学文献的精确匹配
    生成模块开发、集成和调优
    生成模型与检索的集成:精准回答用户提问
    生成内容的优化与提示词调优:提升回答的质量与专业性
    第十三部分: RAG实战案例3- 法律法规查询助手的开发 法律法规需求分析与数据收集
    用户需求解析:明确法律法规查询的主要需求
    法律法规数据源与收集方法:搭建全面的法规数据库
    数据清洗与标准化:提升查询效率和准确性
    法律法规检索模块的实现
    向量化法律条款:构建检索友好的嵌入
    FAISS索引在法规查询中的应用:提升检索性能
    优化检索流程:提高法律条款的匹配精度
    生成模块开发与输出优化
    生成模型与检索模块的集成:构建准确的法规回答
    输出格式与内容优化:提供清晰的法律解释
    提示词调优与模型配置:确保法律回答的专业性
    第十四部分: 企业建设知识库的最佳实践 企业级RAG应用的常见优化策略
    选择合适的知识块大小
    评估知识块大小
    分离检索阶段的知识块与生成阶段的知识块
    常见的分离策略及实现
    优化对大文档集知识库的检索
    元数据过滤 + 向量检索
    摘要检索+ 内容检索
    多文档Agentic RAG
    使用高级检索方法
    构建端到端的企业级RAG应用
    对生产型RAG应用的主要考量
    端到端的企业级RAG应用架构
    数据存储层
    AI模型层
    RAG工作流与API模块
    端到端的全栈RAG应用案例
    简单的全栈RAG查询应用
    基于多文档Agent的端到端对话应用
    第十五部分: RAG 的未来演进 多模态RAG的技术进展和发展路线
    未来的RAG和Agent如何发展
    如何构建企业级的RAG和Agent集群架构
    GraphRAG:RAG和知识图谱的整合
    上下文检索:突破传统RAG的上下文困境
    ModularRAG:从固定流程到灵活架构的跃迁
    AgenticRAG:自主代理驱动的RAG系统
    Multi-Modal RAG:多模态检索增强生成技术
       
    27 次浏览  3 次
    其他人还看了课程
    图像识别与深度学习  4574 次浏览
    人工智能的软件测试应用  3063 次浏览
    大模型与人工反馈强化学习详解实战  1833 次浏览
    AI大 模 型 的 崛 起 与 应 用  1844 次浏览
    ROS2从入门到实践  4630 次浏览
    应用ChatGPT,挖掘更多机会  1056 次浏览
    人工智能、机器学习& TensorFlow+Keras框架实践  11708 次浏览
    定制内训


    最新活动计划
    用户体验、易用性测试与评估 11-5[在线]
    基于模型的数据治理与中台 11-11[北京]
    软件架构设计方法、案例实践 11-13[北京]
    AI智能化软件测试方法与实践11-20[北京]
    UML与面向对象分析设计 11-25[北京]
    LLM大模型与智能体开发实战 11-13[在线]
    配置管理方法、实践、工具 12-11[北京]