求知
文章
文库
Lib
视频
iPerson
课程
认证
咨询
工具
讲座
Model Center
汽车系统工程
模型库
会员
找课
开班计划
|
认证培训
|
技术学院
|
管理学院
|
嵌入式学院
|
机械
|
军工学院
|
定向培养
|
专家指导
|
角色培养
电话
English
成功案例
品质保证
成功案例
某知名气 基于AI大模型开发
某医药企 大模型技术原理及基
中国电信 大模型核心技术RA
中国船舶 AI大模型辅助软件
某公募基 金融领域的AI大模
某著名通 AI大模型全栈工程
某车企 AI大模型应用实践
更多...
相关课程
开源大模型推理、训练与部署
深度学习、目标识别强化学习
(知识图谱+图数据库)*大模型
人工智能.机器学习& PyTorch
人工智能+Python+大数据
深度学习入门与实战
知识图谱建模与应用
更多...
全部课程
>
人工智能
具身智能技能与实践
165 次浏览
3 次
Michael 老师
人工智能企业CEO兼技术负责人。
时间地点
:北京、上海、 深圳 根据报名开班
课程费用:
4500元/人
报公开课
要内训
企业内训:
可以根据企业需求,定制内训,详见
内训学习手册
认证方式:
培训前了解能力模型。
培训后进行能力评测:
在线考试
能力分析,给出学习建议
合格者颁发证书,作为职业技能资格证明
课程简介:
本课程聚焦具身智能前沿,系统讲授如何为大模型赋予“身体”与“行动力”。课程以“感知 推理 动作”为核心架构,涵盖视觉 语言 动作大模型(VLA)、模仿学习与扩散策略、仿真到真机迁移等关键模块。学员将在具体的开发环境中,从零搭建基于大模型的任务规划与灵巧控制系统,并完成一个完整的具身智能项目(如自然语言驱动的机械臂操作)。课程强调理论与实践深度结合,帮助学员掌握构建通用机器人智能体的核心技能,为从事人工智能与机器人前沿研究及工程开发奠定坚实基础。
培训目标:
理解具身智能核心概念:掌握具身智能的基本架构,明确“大脑”(大模型推理)与“小脑”(运动控制)的分工与协同机制。
掌握多模态感知与场景理解:能够运用视觉基础模型与3D重建技术实现开放词汇的目标检测、分割与语义地图构建。
具备运动控制与策略学习能力:熟练应用模仿学习(扩散策略)与强化学习(Sim2Real)方法,在仿真环境中训练机械臂完成灵巧操作任务。
精通视觉‑语言‑动作(VLA)大模型:理解主流VLA模型(RT‑2、OpenVLA)的架构原理,并能够基于LoRA等方法进行模型微调与部署。
实现系统集成与真机部署:能够搭建完整的“感知‑规划‑控制”软件栈,利用ROS 2将大模型推理结果转化为机器人实际动作,并处理延迟与安全机制。
完成综合项目实战:独立或合作完成一个具身智能综合项目(如自然语言驱动的机器人操作),在仿真或真实环境中验证系统的泛化能力与鲁棒性。
培训对象:
人工智能/机器人相关专业研究生、算法工程师、机器人系统开发者
学员基础:
熟练掌握Python;了解深度学习基础(PyTorch/TensorFlow);具备基本的Linux使用经验,最好熟悉C++编程。
课程安排:2天
主题
课程安排
第一节:具身智能核心概念与技术架构
具身智能概述:感知-思考-行动
技能学习:模仿学习与强化学习
任务规划:经典与学习型规划
VLA智能体:多模态融合
人机交互:多模态接口与信任建
具身智能的起源与发展历程
大模型为具身智能带来的变革与赋能
Embodied Al的定义、特点与核心要素
代码实践
机器人操作和抓取任务介绍
硬件环境配置(机械臂、夹爪)
软件环境配置(Ubuntu、ROS、SDK)
从RViz仿真模型到机械臂实机1比1映射
第二节:具身智能技能学习
技能抽象:Options与Motion Primitives
模仿学习:行为克隆与逆强化学习
强化学习在技能学习中的应用
多任务与元技能学习
代码实践
行为克隆(BC)Python实现,模仿专家轨迹
第三节:具身智能体人机交互和任务规划
自然语言理解与生成
人机交互逻辑
经典规划:PDDL语言与规划器
基于学习的分层规划方法
大语言模型(LLM)在任务规划中的辅助与应用
代码实践
机械臂总体实验环境搭建
使用LLM(如GPT)进行高层任务分解实验
第四节:多模态具身智能模型实践-端感知控制
大模型与多模态模型概述
DeepSeek、Qwen-VL等模型及其应用开发
大模型的模型架构
开源模型与微调基础
高效微调技术 LORA
异构硬件与协议栈开发
语音交互系统搭建
代码实践
具身智能小车实现语音-视觉-动作一体化控制,支持复杂环境下的自主任务执行
第五节:多模态具身智能物体识别与抓取
3D 视觉感知基础
3D 数据初步分析
深度相机识别复杂物体
3D数据实时分析进阶
代码实践
手眼标定(Hand-Eye Calibration)
视觉目标检测(YOLO系列)
视觉抓取系统设计
经典机械臂视觉抓取任务
第六节:基于强化学习机械臂抓取
强化学习算法(PPO)
强化学习仿真环境配置
控制策略Sim2Real迁移
代码实践
基于强化学习的抓取
机械臂强化学习抓取
第七节:基于VLA视觉语言动作模型的模仿学习抓取
VLA(视觉-语言-动作)智能体架构介绍
多模态预训练方法
指令微调与适应性学习
实际应用案例解析
代码实践
基于VLA模型的模仿学习抓取策略
遥操作环境搭建
数据采集与模仿学习训练
报公开课
要内训
165 次浏览
3 次
其他人还看了课程
大数据时代人工智能应用与价值创新
1809 次浏览
机器学习和数据挖掘课程
3817 次浏览
Open Claw和Agent Skill原理和实战
540 次浏览
AI 助力职场办公效率提升
1043 次浏览
GPU图像处理核心技术实战
1141 次浏览
金融行业人工智能与数据挖掘实战
4112 次浏览
使用GPU和CUDA 提升 Python程序的性能
3264 次浏览
最新活动计划
嵌入式软件测试方法&实践 3-20[在线]
MBSE理论方法到工作实践 3-28[北京]
需求分析与管理 4-21[在线]
基于LLM的Agent应用开发 4-18[北京]
SysML和EA系统设计建模 4-23[北京]
基于本体的体系架构设计 4-24[北京]
认证课:OCSMP-MU 周末班[在线]