求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Modeler   Code  
会员   
 
 
 
开班计划 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导  
 电话 English
成功案例   品质保证
 
   
成功案例
某交通信 Oracle数据库
某通信设 Python数据分
某通信设 Python数据分
某综合性 人工智能与机器学习
某工程研 数据库设计与优化
知名财险 Oracle数据库
某金融公 Mysql集群与性

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >人工智能  
强化学习及案例实践
741 次浏览  26 次
Aaron
人工智能创业企业创始人.
 
时间地点: 北京 上海 深圳根据报名开班
课程费用:5000元/人
 
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。这几年随着人工智能的应用增加,强化学习逐渐走入人们的视野,本次培训将从实践与原理的角度,对强化学习进行深刻的剖析。

    培训目标:
    • 了解强化学习基础原理与应用
    • 能够熟悉强化学习的基本算法与Q-Learing,Saras,Deep-Q-Network等
    • 能够实现基础的强化学习模型设计
    • 理解马尔科夫模型
    • 熟悉DRL理论
    培训对象:
      1.对强化学习感兴趣的人员,大数据研究人员,人工智能程序员,算法工程师
      2.机器学习算法研究员
      3.强化学习研究员
      4.机器学习算法研究员
    学员基础:了解人工智能基础知识,了解机器学习算法原理
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练

    培训内容:2天

    强化学习基础
    1.马尔科夫决策过程
    • 马尔科夫决策过程理论讲解
    • MDP中的概率学基础
    • 基于GYM的MDP实例讲解
    2. 强化学习基础概念介绍
    3. 强化学习应用案例介绍:
    • 库存优化
    • 用户行为学习
    • 推荐
    • 交易策略评价等
    4. 打造强化学习开发工具箱
    • TensorFlow
    • Keras
    • Anaconda
    • XGboost等
    5. Keras简介
    • 序列模型
    • 函数式模型
    6. 单智力体强化学习
    • 马尔科夫决策过程
    • Q函数
    • 贪婪算法
    • Sarsa算法
    • Q-Learning
    • Deep Q Network算法
    7. 上机案例实践:使用Sarsa算法处理金币问题
    8. 上机案例实践:使用Q Learning算法处理金币问题
    9. 上机案例实践:使用DQN算法处理CartPole问题
    10. Keras-rl简介
    • Keras-rl智能体介绍
    • Keras-rl智能体通用API
    • Keras-rl常用对象
    11. 案例:在Keras-rl下使用SARSA算法处理CartPole问题
    12. 案例:在Keras-rl下使用DQN算法处理CartPole问题
    13.案例:在Keras-rl下使用DQN算法玩Atari游戏
    强化学习进阶与实践 1.OpenAI Gym
    • OpenAI
    • OpenAI Gym
    • Hello World OpenAI Gym
    • 案例实践:Gym环境使用
    2. 恶意程序检测
    • PE文件格式概述
    • PE文件的节
    • PE文件的特征分析
    • PE文件节的特征
    • 检测模型
    3. 智能提升恶意程序检测能力
    • Gym Malware介绍
    • Gym Malware架构
    • PEFeatureExtractor
    • Interface
    • MalwareManipulator
    • DQNAgent
    • MalwareEvn
    4. 智能提升垃圾邮件检测能力
    • 垃圾邮件技术介绍
    • 垃圾邮件绕过技术
    • Gym-Spam架构
    • DQNAgent设计
    • Env设计
     
    741 次浏览  26 次
    其他人还看了课程
    人工智能、机器学习& TensorFlow+Keras框架实践  2342 次浏览
    图像处理算法方法与实践  1148 次浏览
    机器学习和深度学习应用实践指导  450 次浏览
    机器学习系统实践  697 次浏览
    知识图谱建模与应用  500 次浏览
    人工智能前沿:对抗式生成网络GAN  781 次浏览
    定制内训



    最新活动计划
    MBSE(基于模型的系统工程) 10-20[北京]
    软件详细设计、建模与编档 11-1[北京]
    人工智能、机器学习& TensorFlow 11-5[北京]
    需求分析最佳实践与沙盘演练 11-11[北京]
    产品经理与产品管理 11-18[北京]
    软件架构设计方法、案例与实践 10-22[上海]
    云计算、微服务与分布式架构 10-28[上海]
    大数据平台搭建与高性能计算 10-29[上海]
     讲座 基于模型的质量管理
     讲师:俎涛
     时间:2020年10月25日