强化学习及案例实践培训-火龙果软件

咨询

会员

|

|

|

|

嵌入式学院

|

|

|

|

|

成功案例

中航信数据湖架构原理与应

某医疗磁数据采集与处理

某科技公大数据（Hadoo

诺基亚 Python基础

天津电子 Elasticse

中国电信数据仓库与数据挖掘

某航天科 MySQL性能优化

相关课程

并发、大容量、高性能数据库

高级数据库架构设计师

Hadoop原理与实践

HBase原理与高级应用

Oracle 数据仓库

数据仓库和数据挖掘

Oracle数据库开发与管理

全部课程 >人工智能

强化学习及案例实践

3512 次浏览

74 次


Aaron
人工智能创业企业创始人.

时间地点： 北京上海深圳根据报名开班

课程费用：5000元/人

报公开课

企业内训：可以根据企业需求,定制内训,详见内训学习手册

认证方式：
培训前了解能力模型。
培训后进行能力评测：

在线考试

能力分析，给出学习建议

合格者颁发证书，作为职业技能资格证明

强化学习是智能体（Agent）以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏，强化学习不同于连接主义学习中的监督学习，主要表现在教师信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号)，而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少，RLS必须靠自身的经历进行学习。通过这种方式，RLS在行动-评价的环境中获得知识，改进行动方案以适应环境。这几年随着人工智能的应用增加，强化学习逐渐走入人们的视野，本次培训将从实践与原理的角度，对强化学习进行深刻的剖析。

培训目标:

了解强化学习基础原理与应用
能够熟悉强化学习的基本算法与Q-Learing,Saras,Deep-Q-Network等
能够实现基础的强化学习模型设计
理解马尔科夫模型
熟悉DRL理论

培训对象:

学员基础：了解人工智能基础知识，了解机器学习算法原理

授课方式： 定制课程 + 案例讲解 + 小组讨论，60%案例讲解，40%实践演练

培训内容：2天

强化学习基础

1.马尔科夫决策过程

马尔科夫决策过程理论讲解
MDP中的概率学基础
基于GYM的MDP实例讲解

2. 强化学习基础概念介绍
3. 强化学习应用案例介绍:

库存优化
用户行为学习
推荐
交易策略评价等

4. 打造强化学习开发工具箱

TensorFlow
Keras
Anaconda
XGboost等

5. Keras简介

序列模型
函数式模型

6. 单智力体强化学习

马尔科夫决策过程
Q函数
贪婪算法
Sarsa算法
Q-Learning
Deep Q Network算法

7. 上机案例实践：使用Sarsa算法处理金币问题
8. 上机案例实践：使用Q Learning算法处理金币问题
9. 上机案例实践：使用DQN算法处理CartPole问题
10. Keras-rl简介

Keras-rl智能体介绍
Keras-rl智能体通用API
Keras-rl常用对象

11. 案例：在Keras-rl下使用SARSA算法处理CartPole问题
12. 案例：在Keras-rl下使用DQN算法处理CartPole问题
13.案例：在Keras-rl下使用DQN算法玩Atari游戏

强化学习进阶与实践

1.OpenAI Gym

OpenAI
OpenAI Gym
Hello World OpenAI Gym
案例实践：Gym环境使用

2. 恶意程序检测

PE文件格式概述
PE文件的节
PE文件的特征分析
PE文件节的特征
检测模型

3. 智能提升恶意程序检测能力

Gym Malware介绍
Gym Malware架构
PEFeatureExtractor
Interface
MalwareManipulator
DQNAgent
MalwareEvn

4. 智能提升垃圾邮件检测能力

垃圾邮件技术介绍
垃圾邮件绕过技术
Gym-Spam架构
DQNAgent设计
Env设计

3512 次浏览

74 次

其他人还看了课程

深度学习与图像处理 4004 次浏览

Neo4j图算法工程师 2783 次浏览

知识图谱构建方法与技术（金融行业） 3088 次浏览

人工智能概况和前沿展望 3312 次浏览

TensorFlow 架构和应用 4049 次浏览

DeepSeek赋能，让商业分析与决策领先一步 704 次浏览

DeepSeek赋能职场：从小白到AI高手蜕变 1511 次浏览

最新活动计划

基于 UML 和EA进行分析设计 7-30[北京]

大模型RAG、MCP与智能体 8-14[厦门]

软件架构设计方法、案例与实践 7-24[北京]

用户体验、易用性测试与评估 7-25[西安]

图数据库与知识图谱 8-23[北京]

需求分析师能力培养 8-28[北京]