求知 文章 文库 Lib 视频 iProcess 课程 认证 咨询 工具 讲座 Modeler   Code  
会员   
 
 
 
开班计划 | 技术学院 | 管理学院 | 嵌入式学院 | 电子&机械 | 军工学院 | 定向培养 | 专家指导  
 电话 English
成功案例   品质保证
 
   
成功案例
某通信设 Python数据分
某综合性 人工智能与机器学习
某工程研 数据库设计与优化
知名财险 Oracle数据库
某金融公 Mysql集群与性
知名某信 NoSQL缓存数据
财政部唯 大数据分析专题-R

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >人工智能  
强化学习及案例实践
530 次浏览  25 次
Aaron
人工智能创业企业创始人.
 
时间地点: 北京 上海 深圳根据报名开班
课程费用:5000元/人
 
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。这几年随着人工智能的应用增加,强化学习逐渐走入人们的视野,本次培训将从实践与原理的角度,对强化学习进行深刻的剖析。

    培训目标:
    • 了解强化学习基础原理与应用
    • 能够熟悉强化学习的基本算法与Q-Learing,Saras,Deep-Q-Network等
    • 能够实现基础的强化学习模型设计
    • 理解马尔科夫模型
    • 熟悉DRL理论
    培训对象:
      1.对强化学习感兴趣的人员,大数据研究人员,人工智能程序员,算法工程师
      2.机器学习算法研究员
      3.强化学习研究员
      4.机器学习算法研究员
    学员基础:了解人工智能基础知识,了解机器学习算法原理
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练

    培训内容:2天

    强化学习基础
    1.马尔科夫决策过程
    • 马尔科夫决策过程理论讲解
    • MDP中的概率学基础
    • 基于GYM的MDP实例讲解
    2. 强化学习基础概念介绍
    3. 强化学习应用案例介绍:
    • 库存优化
    • 用户行为学习
    • 推荐
    • 交易策略评价等
    4. 打造强化学习开发工具箱
    • TensorFlow
    • Keras
    • Anaconda
    • XGboost等
    5. Keras简介
    • 序列模型
    • 函数式模型
    6. 单智力体强化学习
    • 马尔科夫决策过程
    • Q函数
    • 贪婪算法
    • Sarsa算法
    • Q-Learning
    • Deep Q Network算法
    7. 上机案例实践:使用Sarsa算法处理金币问题
    8. 上机案例实践:使用Q Learning算法处理金币问题
    9. 上机案例实践:使用DQN算法处理CartPole问题
    10. Keras-rl简介
    • Keras-rl智能体介绍
    • Keras-rl智能体通用API
    • Keras-rl常用对象
    11. 案例:在Keras-rl下使用SARSA算法处理CartPole问题
    12. 案例:在Keras-rl下使用DQN算法处理CartPole问题
    13.案例:在Keras-rl下使用DQN算法玩Atari游戏
    强化学习进阶与实践 1.OpenAI Gym
    • OpenAI
    • OpenAI Gym
    • Hello World OpenAI Gym
    • 案例实践:Gym环境使用
    2. 恶意程序检测
    • PE文件格式概述
    • PE文件的节
    • PE文件的特征分析
    • PE文件节的特征
    • 检测模型
    3. 智能提升恶意程序检测能力
    • Gym Malware介绍
    • Gym Malware架构
    • PEFeatureExtractor
    • Interface
    • MalwareManipulator
    • DQNAgent
    • MalwareEvn
    4. 智能提升垃圾邮件检测能力
    • 垃圾邮件技术介绍
    • 垃圾邮件绕过技术
    • Gym-Spam架构
    • DQNAgent设计
    • Env设计
     
    530 次浏览  25 次
    其他人还看了课程
    人工智能-图像处理和识别  260 次浏览
    人工智能、机器学习与实现框架(python、tensorflow、keras)  156 次浏览
    机器学习应用实践  1024 次浏览
    机器学习和数据挖掘课程  915 次浏览
    金融行业人工智能与数据挖掘实战  306 次浏览
    强化学习及案例实践  530 次浏览
    定制内训



    最新活动计划
    测试需求分析与测试用例设计 12-17[北京]
    软件架构设计方法、案例与实践 12-18[北京]
    ANSYS 有限元分析实战 12-20[北京]
    基于UML和EA进行系统分析设计 12-26[北京]
    嵌入式C高质量编程 12-12 [上海]
    区块链项目解析与项目实战 12-27[上海]
    基于SysML和EA系统设计建模 12-16 [深圳]
     讲座 5G网络技术
     讲师:林尚静
     时间:2019-12-28