|
|
全部课程 >人工智能 |
|
强化学习及案例实践 |
2797 次浏览 52 次
|
|
|
时间地点: 北京 上海 深圳根据报名开班 |
课程费用:5000元/人 |
|
|
|
企业内训:可以根据企业需求,定制内训,详见
内训学习手册 |
|
|
认证方式:
培训前了解能力模型。
培训后进行能力评测:
在线考试
能力分析,给出学习建议
合格者颁发证书,作为职业技能资格证明
|
|
|
|
强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement
learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。这几年随着人工智能的应用增加,强化学习逐渐走入人们的视野,本次培训将从实践与原理的角度,对强化学习进行深刻的剖析。 |
培训目标: |
- 了解强化学习基础原理与应用
- 能够熟悉强化学习的基本算法与Q-Learing,Saras,Deep-Q-Network等
- 能够实现基础的强化学习模型设计
- 理解马尔科夫模型
- 熟悉DRL理论
|
培训对象: |
1.对强化学习感兴趣的人员,大数据研究人员,人工智能程序员,算法工程师
2.机器学习算法研究员
3.强化学习研究员
4.机器学习算法研究员 |
学员基础:了解人工智能基础知识,了解机器学习算法原理 |
授课方式: 定制课程 + 案例讲解
+ 小组讨论,60%案例讲解,40%实践演练 |
培训内容:2天
|
强化学习基础
|
1.马尔科夫决策过程
- 马尔科夫决策过程理论讲解
- MDP中的概率学基础
- 基于GYM的MDP实例讲解
2. 强化学习基础概念介绍
3. 强化学习应用案例介绍:
4. 打造强化学习开发工具箱
- TensorFlow
- Keras
- Anaconda
- XGboost等
5. Keras简介
6. 单智力体强化学习
- 马尔科夫决策过程
- Q函数
- 贪婪算法
- Sarsa算法
- Q-Learning
- Deep Q Network算法
7. 上机案例实践:使用Sarsa算法处理金币问题
8. 上机案例实践:使用Q Learning算法处理金币问题
9. 上机案例实践:使用DQN算法处理CartPole问题
10. Keras-rl简介
- Keras-rl智能体介绍
- Keras-rl智能体通用API
- Keras-rl常用对象
11. 案例:在Keras-rl下使用SARSA算法处理CartPole问题
12. 案例:在Keras-rl下使用DQN算法处理CartPole问题
13.案例:在Keras-rl下使用DQN算法玩Atari游戏 |
强化学习进阶与实践 |
1.OpenAI
Gym
- OpenAI
- OpenAI Gym
- Hello World OpenAI Gym
- 案例实践:Gym环境使用
2. 恶意程序检测
- PE文件格式概述
- PE文件的节
- PE文件的特征分析
- PE文件节的特征
- 检测模型
3. 智能提升恶意程序检测能力
- Gym Malware介绍
- Gym Malware架构
- PEFeatureExtractor
- Interface
- MalwareManipulator
- DQNAgent
- MalwareEvn
4. 智能提升垃圾邮件检测能力
- 垃圾邮件技术介绍
- 垃圾邮件绕过技术
- Gym-Spam架构
- DQNAgent设计
- Env设计
|
|
|
|
|
|
|
|
|
2797 次浏览 52 次
|
其他人还看了课程 |
|
|
|