求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   模型库  
会员   
 
 
 
  开班计划 | 认证培训 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导 | 角色培养  
 电话 English
成功案例   品质保证
成功案例
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘
某航天科 MySQL性能优化

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >人工智能  
大模型核心技术RAG、MCP与智能体实践
20 次浏览  1 次
Williams
计算可视化博士,人工智能公司创始人,技术负责人。
 
时间地点:厦门 2025年8月14 - 8月15日;北京、 深圳、上海根据报名开班
课程费用:4500元/人
报公开课  
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


      课程覆盖从大模型部署到高级应用的完整链条,结合跨模态检索RAG、MCP自定义工具、智能体实现等前沿技术,融入最新学术界成果。以实用技术为导向,完整呈现大模型的项目应用。

    课程目标:
    1. 大模型提示工程与智能软件组合应用
    2. 本地大模型私有化部署实操
    3 使用蒸馏大模型完成微调、数据准备过程、模型训练代码实践
    4.知识库建设与多模态RAG提高召回
    5. MCP协议及其代码落地——自定义工具
    6. 强化学习算法与MCP集成
    7. 基于平台的Agent 智能体开发
    8. 多模态智能体技术实现
    培训对象:本课程面向有一定经验的数据分析师、AI工程师或业务建模人员。
    学员基础:有Python基础
    授课方式:内容讲解+案例分析+实战练习,人手一机,提前发送实验环境与案例资料,课上边学边练。
    培训内容:2天
    主题
    课程安排
    第一节:大模型提示工程与智能软件组合应用 1. 文件分类与检索优化
    2. 利用 DeepSeek 的语义分析能力,对文件进行智能分类
    3. 构建高效的文件检索系统,通过关键词和语义搜索快速定位文件
    4. 文件内容提取与分析
    5. 从各类文档中提取关键信息,如合同中的条款、报告中的数据等
    6. 运用 DeepSeek 进行文本数据分析,生成可视化报告
    7. 不同岗位文件处理重点应用
    8. 自动化报告生成:整合多平台数据生成日报/周报
    9. DeepSeek在Excel中的应用
    10. DeepSeek在数据分析实战演练
    11. DeepSeek在Excel问题解决、思路构建等方面的应用方法
    12. DeepSeek生成Excel函数的用法
    13. 使用DeepSeek大模型辅助数据分析
    14. 利用 DeepSeek 生成 PPT 大纲和PPT精修
    15. 与DeepSeek对话,获取讲故事和写作技巧
    16. 根据大纲,使用 DeepSeek 获取相关图片、案例等素材
    17. AI做海报、banner、详情图、做场景广告图
    18. 视频素材智能检索:通过语义标签快速匹配历史素材库(如节日营销内容复用)。
    19. 视频质量优化:自动检测画质、音效问题并修复(如直播回放优化)。
    20. 企业服务视频智能化
    21. 软件需求转化为测试用例生成目标
    22. 设计基于规则或数据驱动的生成模型架构
    23. 生成策略优化
    24. 如何对生成的测试用例进行质量审核
    25. 不同软件项目中的测试用例生成实践
    第二节:本地大模型私有化部署实操 1 Deepseek-R1 蒸馏版的部署实操
    1. 模型获取
      • 通过 HuggingFace 官方仓库申请权限
      • 下载 deepseek-r1-7B 、 8B 、 32B 、 70B 的 safetensors 格式权重
    2. 推理服务启动
      • 关键参数 trust_remote_code 、 max_model_len 等的讲解
      • 解释器多种启动服务方式对比
    3. 服务验证
      • 代码调用
      • 服务 API 的参数设置
    2 Deepseek-R1 蒸馏版部署流程
    1. 模型获取
      • HuggingFace / Modelscope / github 的参数下载
    2. 硬件配置说明
      • 根据模型参数估计显存使用的方法
    3. 对标模型的比较
      • QwQ 系列的突然开源
      • Qwen3 和 DeepSeek 的对比
    3 Qwen3 的部署
    1. 量化加速
      • FP8 的特点
      • 对比 Deepseek 原论文中量化章节的解读
    2. REST API 调用
      • 深度学习系统部署的常用方式
      • 针对 AI 算法的部署框架
    第三节:使用蒸馏大模型完成微调、数据准备过程、模型训练代码实践 1 Deepseek-R1 领域数据微调
    1. 数据准备
      • 格式: JSONL 文件,每条含 instruction/input/output
      • 数据源:财报、券商研报、金融问答对、运营商问答对、意图识别数据
      • 关键处理:使用 SentencePiece 重组专业术语 tokenization
    2. QLoRA 训练配置
      • 微调在大模型中的常用方法
      • 多种 LoRA 方式的对别
    3. 启动训练
      • 显存优化
      • GPU 并行
    2 探讨适合微调的业务场景
      • 阐述项目中 RAG 模式和 LoRA 模式的选择
      • 探讨微调方案的优势,分析不适合微调的场景
    3. UI 缺陷检测 - 多模态微调实践
      • 图像、文本、音频等多模态数据融合原理
      • 基于预训练模型进行多模态微调操作
      • 收集、标注多模态 UI 缺陷数据
      • 模型选择与训练
      • 从数据预处理到模型部署的完整操作流程
      • 缺陷检测效果评估
      • 大型软件项目中的 UI 缺陷检测
    第四节:知识库建设与多模态RAG提高召回 1 私有数据的文档生成系统全流程实操
    架构设计
    1. 数据层 : Wind API 实时获取宏观指标 + PDF 解析模块
    2. 推理层
      • Deepseek-R1 作为生成核心
      • Mistral-8x7B 进行事实核查
    3. 评估层
      • Rouge-L 评估内容一致性
      • FinBERT 检测财务数据矛盾
    2.以部署拓扑理清整体脉络
    常规分析、复杂计算、数据采集、向量数据库、路由决策、 Deepseek-R1/Mistral-8x7B 、合规审查、 PDF 输出
    3 基于知识库的问答系统实操
    关键技术点
    1. RAG 增强
      • 使用 LlamaIndex 构建行业知识图谱
      • FAISS 向量库实现百万级文档秒级检索
    2. 记忆管理
      • 缓存最近轮次的对话摘要
      • 采用 CoT ( Chain-of-Thought )提示工程技术
    3. 风控拦截
      • 关键词过滤(如“保证收益”、“ 100% ”等违规表述)
      • 置信度阈值设定( softmax 概率 <0.7 时触发人工接管)
    第五节:MCP协议及其代码落地——自定义工具 1、MCP 技术核心内容
    • 协议架构与设计原理
    • 客户端-服务器模型:MCP Host、Client、Server的交互逻辑
    • 上下文感知与多步骤任务
    • 任务链式调用,通过多次工具调用完成复杂推理
    • 关键技术特性:介绍 JSON-RPC 2.0
    • 安全机制:沙盒隔离、零信任架构、敏感数据本地化处理
    • 在 IDE 中直接调用代码审查、数据库查询、整合影像与表格数据等应用场景
    2、A2A 技术核心内容
    • 协议架构与协作机制
    • 任务状态管理:任务提交、处理中和完成/失败的全生命周期管理
    • 动态代理发现:Agent Card 元数据文件、权限协商与功能匹配
    • 关键技术特性:安全设计、高并发支持、多Agent协同
    • 复杂任务分解
    3、其他相关配套技术与工具
    • 底层通信协议
    • WebSocket适配云端与边缘计算场景
    • 开发框架与生态
    • 生态工具Mintlify、OpenTools
    • 分布式训练框架PyTorch Distributed、DeepSpeed
    4、实践:uv内置工具和自定义工具
    • 状态空间离散化方法
    • MCP代码实现的步骤和全流程
    第六节:强化学习算法与MCP集成 1.深度强化学习(DRL)算法精讲
    • 算法原理与MCP适配性分析:
    • DQN:Experience Replay与Target Network实现
    • PPO:重要性采样与Clipped Surrogate Objective
    • MADDPG:集中式训练与分布式执行范式
    • 实践:在MCP中实现Atari游戏Agent
    • Frame Stacking预处理
    • 分布式推理加速
    2.多智能体协同
    • 经典协作模型:
    • STRAW
    • COMA
    • 实践:简单合作任务
    • DeepMind的SIMON架构图解(记忆优先设计)
    • Anthropic的Constitutional AI安全层设计
    • 与大模型的协同关系
    • 能力互补图谱
    • 代码智能体的工作机制与核心能力
    • 代码变更检测到影响范围评估的完整流程
    • 代码解析、依赖关系挖掘等技术实现方式
    • 设计基于机器学习的变更影响预测模型
    • 代码变更检测测试
    第七节:基于平台的Agent 智能体开发 1.零基础开发AI Agent 智能体
    • 初步认识Agent
    • Agent的概念与发展
    • Agent是高层级的AI技术应用
    • Agent的特点与能力
    • Agent开发平台的演进
    • 基于字节扣子code平台开发Agent
    2.平台核心能力解析
    • 架构特性:可视化编排 vs 代码深度定制
    • 能力矩阵
    • 知识库管理:支持PDF/CSV/Markdown多格式
    • 对话引擎:基于LLM的意图识别准确率
    • 复杂业务流:需通过API扩展
    • 高级功能拓展
    • 自定义插件开发
    • 多轮对话策略设计
    • Agent 测试与优化
    • 创建应用、知识库配置、对话流程设计、调试技巧
    3. Agent开发
    • 自定义插件开发实战
    • 开发收益率计算插件
    • 创建Python插件脚手架
    • 实现核心逻辑
    • 复杂对话策略设计
    • 多轮状态管理方案
    4. Agent优化
    • 性能调优方案
    • 缓存策略:为高频查询添加Redis缓存层
    • 负载均衡:配置Nginx反向代理实现多实例分发
    • 敏感信息过滤:正则表达式拦截敏感信息
    4.智能体实战
    • 开发Agent的流程与策略
    • Agent开发的功能模块详解——插件、工作流、图像流
    • Agent开发的功能模块详解——知识库、记忆与对话体验
    • 实战篇——5大场景、11个Agent案例
    第八节:多模态智能体技术实现 1.多模态处理管道
    • 模态对齐:CLIP-style跨模态嵌入空间构建
    • 模态融合:Attention-Based Fusion Layer设计
    • 决策统一:跨模态指令的神经符号转换
    2.实现方案对比
    3.认知架构创新
    • 世界模型(World Model)的具身应用
    • 记忆增强方案:MemGPT的分层记忆管理
    4.群体智能演进
    • Agent Swarm技术:AutoGen的多角色协作机制
    • 联邦学习在分布式Agent中的应用
    • 智能体的自然语言理解、图像识别等基础能力进行专项测试
    • 验证智能体在日志、代码、测试报告等数据融合下的检测效果
    • 缺陷分类准确性测试
    • 智能体在高并发场景下的缺陷检测响应速度与稳定性
    • 通过测试数据优化智能体的缺陷检测阈值与策略
    • 人机协同测试
       
    20 次浏览  1 次
    其他人还看了课程
    深度学习与图像处理  3946 次浏览
    Neo4j图算法工程师   2741 次浏览
    知识图谱构建方法与技术(金融行业)  3047 次浏览
    DeepSeek赋能,让商业分析与决策领先一步  649 次浏览
    DeepSeek赋能职场:从小白到AI高手蜕变  1430 次浏览
    人工智能概况和前沿展望  3285 次浏览
    DeepSeek大模型应用开发最佳实践  4392 次浏览
    定制内训
    最新活动计划
    人工智能.机器学习TensorFlow 6-30[直播]
    基于 UML 和EA进行分析设计 7-30[北京]
    软件架构设计方法、案例与实践 7-24[北京]
    用户体验、易用性测试与评估 7-25[西安]
    图数据库与知识图谱 8-23[北京]
    需求分析师能力培养 8-28[北京]