课程：具身智能技能与实践

咨询

成功案例

相关课程

全部课程 >人工智能

具身智能技能与实践

3905 次浏览

6 次

Michael 老师
人工智能企业CEO兼技术负责人。

时间地点：厦门：6月11-12日；上海、深圳根据报名开班

课程费用：4500元/人

报公开课		要内训

企业内训：可以根据企业需求,定制内训,详见内训学习手册

认证方式：
培训前了解能力模型。
培训后进行能力评测：

在线考试

能力分析，给出学习建议

合格者颁发证书，作为职业技能资格证明

课程简介：

本课程聚焦具身智能前沿，系统讲授如何为大模型赋予“身体”与“行动力”。课程以“感知推理动作”为核心架构，涵盖视觉语言动作大模型（VLA）、模仿学习与扩散策略、仿真到真机迁移等关键模块。学员将在具体的开发环境中，从零搭建基于大模型的任务规划与灵巧控制系统，并完成一个完整的具身智能项目（如自然语言驱动的机械臂操作）。课程强调理论与实践深度结合，帮助学员掌握构建通用机器人智能体的核心技能，为从事人工智能与机器人前沿研究及工程开发奠定坚实基础。

培训目标：

理解具身智能核心概念：掌握具身智能的基本架构，明确“大脑”（大模型推理）与“小脑”（运动控制）的分工与协同机制。
掌握多模态感知与场景理解：能够运用视觉基础模型与3D重建技术实现开放词汇的目标检测、分割与语义地图构建。
具备运动控制与策略学习能力：熟练应用模仿学习（扩散策略）与强化学习（Sim2Real）方法，在仿真环境中训练机械臂完成灵巧操作任务。
精通视觉‑语言‑动作（VLA）大模型：理解主流VLA模型（RT‑2、OpenVLA）的架构原理，并能够基于LoRA等方法进行模型微调与部署。
实现系统集成与真机部署：能够搭建完整的“感知‑规划‑控制”软件栈，利用ROS 2将大模型推理结果转化为机器人实际动作，并处理延迟与安全机制。
完成综合项目实战：独立或合作完成一个具身智能综合项目（如自然语言驱动的机器人操作），在仿真或真实环境中验证系统的泛化能力与鲁棒性。

培训对象：

人工智能/机器人相关专业研究生、算法工程师、机器人系统开发者

学员基础：

熟练掌握Python；了解深度学习基础（PyTorch/TensorFlow）；具备基本的Linux使用经验,最好熟悉C++编程。

课程安排：2天

主题	课程安排
第一节：具身智能核心概念与技术架构	具身智能概述：感知-思考-行动技能学习：模仿学习与强化学习任务规划：经典与学习型规划 VLA智能体：多模态融合人机交互：多模态接口与信任建具身智能的起源与发展历程大模型为具身智能带来的变革与赋能 Embodied Al的定义、特点与核心要素代码实践机器人操作和抓取任务介绍硬件环境配置（机械臂、夹爪）软件环境配置（Ubuntu、ROS、SDK）从RViz仿真模型到机械臂实机1比1映射
第二节：具身智能技能学习	技能抽象：Options与Motion Primitives 模仿学习：行为克隆与逆强化学习强化学习在技能学习中的应用多任务与元技能学习代码实践行为克隆（BC）Python实现，模仿专家轨迹
第三节：具身智能体人机交互和任务规划	自然语言理解与生成人机交互逻辑经典规划：PDDL语言与规划器基于学习的分层规划方法大语言模型（LLM）在任务规划中的辅助与应用代码实践机械臂总体实验环境搭建使用LLM（如GPT）进行高层任务分解实验
第四节：多模态具身智能模型实践-端感知控制	大模型与多模态模型概述 DeepSeek、Qwen-VL等模型及其应用开发大模型的模型架构开源模型与微调基础高效微调技术 LORA 异构硬件与协议栈开发语音交互系统搭建代码实践具身智能小车实现语音-视觉-动作一体化控制，支持复杂环境下的自主任务执行
第五节：多模态具身智能物体识别与抓取	3D 视觉感知基础 3D 数据初步分析深度相机识别复杂物体 3D数据实时分析进阶代码实践手眼标定（Hand-Eye Calibration）视觉目标检测（YOLO系列）视觉抓取系统设计经典机械臂视觉抓取任务
第六节：基于强化学习机械臂抓取	强化学习算法（PPO）强化学习仿真环境配置控制策略Sim2Real迁移代码实践基于强化学习的抓取机械臂强化学习抓取
第七节：基于VLA视觉语言动作模型的模仿学习抓取	VLA（视觉-语言-动作）智能体架构介绍多模态预训练方法指令微调与适应性学习实际应用案例解析代码实践基于VLA模型的模仿学习抓取策略遥操作环境搭建数据采集与模仿学习训练