求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center 汽车系统工程   模型库  
会员   
 
 
 
  开班计划 | 认证培训 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导 | 角色培养  
 电话 English
成功案例   品质保证
成功案例
某知名气 基于AI大模型开发
某医药企 大模型技术原理及基
中国电信 大模型核心技术RA
中国船舶 AI大模型辅助软件
某公募基 金融领域的AI大模
某著名通 AI大模型全栈工程
某车企 AI大模型应用实践

相关课程  
开源大模型推理、训练与部署
深度学习、目标识别强化学习
(知识图谱+图数据库)*大模型
人工智能.机器学习& PyTorch
人工智能+Python+大数据
深度学习入门与实战
知识图谱建模与应用
 
全部课程 >人工智能  
具身智能技能与实践
165 次浏览  3 次
Michael 老师
人工智能企业CEO兼技术负责人。
 
时间地点:北京、上海、 深圳 根据报名开班
课程费用:4500元/人
报公开课  
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    课程简介:

           本课程聚焦具身智能前沿,系统讲授如何为大模型赋予“身体”与“行动力”。课程以“感知 推理 动作”为核心架构,涵盖视觉 语言 动作大模型(VLA)、模仿学习与扩散策略、仿真到真机迁移等关键模块。学员将在具体的开发环境中,从零搭建基于大模型的任务规划与灵巧控制系统,并完成一个完整的具身智能项目(如自然语言驱动的机械臂操作)。课程强调理论与实践深度结合,帮助学员掌握构建通用机器人智能体的核心技能,为从事人工智能与机器人前沿研究及工程开发奠定坚实基础。
    培训目标:
    • 理解具身智能核心概念:掌握具身智能的基本架构,明确“大脑”(大模型推理)与“小脑”(运动控制)的分工与协同机制。
    • 掌握多模态感知与场景理解:能够运用视觉基础模型与3D重建技术实现开放词汇的目标检测、分割与语义地图构建。
    • 具备运动控制与策略学习能力:熟练应用模仿学习(扩散策略)与强化学习(Sim2Real)方法,在仿真环境中训练机械臂完成灵巧操作任务。
    • 精通视觉‑语言‑动作(VLA)大模型:理解主流VLA模型(RT‑2、OpenVLA)的架构原理,并能够基于LoRA等方法进行模型微调与部署。
    • 实现系统集成与真机部署:能够搭建完整的“感知‑规划‑控制”软件栈,利用ROS 2将大模型推理结果转化为机器人实际动作,并处理延迟与安全机制。
    • 完成综合项目实战:独立或合作完成一个具身智能综合项目(如自然语言驱动的机器人操作),在仿真或真实环境中验证系统的泛化能力与鲁棒性。
    培训对象:

    人工智能/机器人相关专业研究生、算法工程师、机器人系统开发者
    学员基础:

    熟练掌握Python;了解深度学习基础(PyTorch/TensorFlow);具备基本的Linux使用经验,最好熟悉C++编程。
    课程安排:2天
    主题 课程安排
    第一节:具身智能核心概念与技术架构
    • 具身智能概述:感知-思考-行动
    • 技能学习:模仿学习与强化学习
    • 任务规划:经典与学习型规划
    • VLA智能体:多模态融合
    • 人机交互:多模态接口与信任建
    • 具身智能的起源与发展历程
    • 大模型为具身智能带来的变革与赋能
    • Embodied Al的定义、特点与核心要素
    • 代码实践
      • 机器人操作和抓取任务介绍
      • 硬件环境配置(机械臂、夹爪)
      • 软件环境配置(Ubuntu、ROS、SDK)
      • 从RViz仿真模型到机械臂实机1比1映射
    第二节:具身智能技能学习
    • 技能抽象:Options与Motion Primitives
    • 模仿学习:行为克隆与逆强化学习
    • 强化学习在技能学习中的应用
    • 多任务与元技能学习
    • 代码实践
      • 行为克隆(BC)Python实现,模仿专家轨迹
    第三节:具身智能体人机交互和任务规划
    • 自然语言理解与生成
    • 人机交互逻辑
    • 经典规划:PDDL语言与规划器
    • 基于学习的分层规划方法
    • 大语言模型(LLM)在任务规划中的辅助与应用
    • 代码实践
      • 机械臂总体实验环境搭建
      • 使用LLM(如GPT)进行高层任务分解实验
    第四节:多模态具身智能模型实践-端感知控制
    • 大模型与多模态模型概述
    • DeepSeek、Qwen-VL等模型及其应用开发
    • 大模型的模型架构
    • 开源模型与微调基础
    • 高效微调技术 LORA
    • 异构硬件与协议栈开发
    • 语音交互系统搭建
    • 代码实践
      • 具身智能小车实现语音-视觉-动作一体化控制,支持复杂环境下的自主任务执行
    第五节:多模态具身智能物体识别与抓取
    • 3D 视觉感知基础
    • 3D 数据初步分析
    • 深度相机识别复杂物体
    • 3D数据实时分析进阶
    • 代码实践
      • 手眼标定(Hand-Eye Calibration)
      • 视觉目标检测(YOLO系列)
      • 视觉抓取系统设计
      • 经典机械臂视觉抓取任务
    第六节:基于强化学习机械臂抓取
    • 强化学习算法(PPO)
    • 强化学习仿真环境配置
    • 控制策略Sim2Real迁移
    • 代码实践
      • 基于强化学习的抓取
      • 机械臂强化学习抓取
    第七节:基于VLA视觉语言动作模型的模仿学习抓取
    • VLA(视觉-语言-动作)智能体架构介绍
    • 多模态预训练方法
    • 指令微调与适应性学习
    • 实际应用案例解析
    • 代码实践
      • 基于VLA模型的模仿学习抓取策略
      • 遥操作环境搭建
      • 数据采集与模仿学习训练
       
    165 次浏览  3 次
    其他人还看了课程
    大数据时代人工智能应用与价值创新  1809 次浏览
    机器学习和数据挖掘课程  3817 次浏览
    Open Claw和Agent Skill原理和实战  540 次浏览
    AI 助力职场办公效率提升  1043 次浏览
    GPU图像处理核心技术实战  1141 次浏览
    金融行业人工智能与数据挖掘实战  4112 次浏览
    使用GPU和CUDA 提升 Python程序的性能   3264 次浏览
    定制内训


    最新活动计划
    嵌入式软件测试方法&实践 3-20[在线]
    MBSE理论方法到工作实践 3-28[北京]
    需求分析与管理 4-21[在线]
    基于LLM的Agent应用开发 4-18[北京]
    SysML和EA系统设计建模 4-23[北京]
    基于本体的体系架构设计 4-24[北京]
    认证课:OCSMP-MU 周末班[在线]