求知 文章 文库 Lib 视频 Code iProcess 课程 角色 咨询 工具 火云堂 讲座吧   建模者  
会员   
 
 
 
开班计划 | 技术学院 | 管理学院 | 嵌入式学院 | 电子&机械 | 在线学院  
成功案例   品质保证  电话 English
追随技术信仰

随时听讲座
每天看新闻
 
   
成功案例
某工程研 数据库设计与优化
知名财险 Oracle数据库
某金融公 Mysql集群与性
知名某信 NoSQL缓存数据
财政部唯 大数据分析专题-R
神龙汽车 大数据技术平台-H
中国电信 大数据时代与现代企

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >人工智能  
强化学习及案例实践
355 次浏览  23 次
Aaron
人工智能创业企业创始人.
 
时间地点: 北京 上海 深圳根据报名开班
课程费用:5000元/人
 
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。这几年随着人工智能的应用增加,强化学习逐渐走入人们的视野,本次培训将从实践与原理的角度,对强化学习进行深刻的剖析。

    培训目标:
    • 了解强化学习基础原理与应用
    • 能够熟悉强化学习的基本算法与Q-Learing,Saras,Deep-Q-Network等
    • 能够实现基础的强化学习模型设计
    • 理解马尔科夫模型
    • 熟悉DRL理论
    培训对象:
      1.对强化学习感兴趣的人员,大数据研究人员,人工智能程序员,算法工程师
      2.机器学习算法研究员
      3.强化学习研究员
      4.机器学习算法研究员
    学员基础:了解人工智能基础知识,了解机器学习算法原理
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练

    培训内容:2天

    强化学习基础
    1.马尔科夫决策过程
    • 马尔科夫决策过程理论讲解
    • MDP中的概率学基础
    • 基于GYM的MDP实例讲解
    2. 强化学习基础概念介绍
    3. 强化学习应用案例介绍:
    • 库存优化
    • 用户行为学习
    • 推荐
    • 交易策略评价等
    4. 打造强化学习开发工具箱
    • TensorFlow
    • Keras
    • Anaconda
    • XGboost等
    5. Keras简介
    • 序列模型
    • 函数式模型
    6. 单智力体强化学习
    • 马尔科夫决策过程
    • Q函数
    • 贪婪算法
    • Sarsa算法
    • Q-Learning
    • Deep Q Network算法
    7. 上机案例实践:使用Sarsa算法处理金币问题
    8. 上机案例实践:使用Q Learning算法处理金币问题
    9. 上机案例实践:使用DQN算法处理CartPole问题
    10. Keras-rl简介
    • Keras-rl智能体介绍
    • Keras-rl智能体通用API
    • Keras-rl常用对象
    11. 案例:在Keras-rl下使用SARSA算法处理CartPole问题
    12. 案例:在Keras-rl下使用DQN算法处理CartPole问题
    13.案例:在Keras-rl下使用DQN算法玩Atari游戏
    强化学习进阶与实践 1.OpenAI Gym
    • OpenAI
    • OpenAI Gym
    • Hello World OpenAI Gym
    • 案例实践:Gym环境使用
    2. 恶意程序检测
    • PE文件格式概述
    • PE文件的节
    • PE文件的特征分析
    • PE文件节的特征
    • 检测模型
    3. 智能提升恶意程序检测能力
    • Gym Malware介绍
    • Gym Malware架构
    • PEFeatureExtractor
    • Interface
    • MalwareManipulator
    • DQNAgent
    • MalwareEvn
    4. 智能提升垃圾邮件检测能力
    • 垃圾邮件技术介绍
    • 垃圾邮件绕过技术
    • Gym-Spam架构
    • DQNAgent设计
    • Env设计
     
    355 次浏览  23 次
    其他人还看了课程
    图像处理算法方法与实践  484 次浏览
    机器学习和深度学习应用实践指导  234 次浏览
    机器学习系统实践  299 次浏览
    人工智能前沿:对抗式生成网络GAN  459 次浏览
    机器学习与大数据的应用结合  1605 次浏览
    基于R的影响预测模型建立实战  486 次浏览
    定制内训



    最新活动计划
    [北京]嵌入式软件架构设计高级实践 6-18
    [北京]产品需求分析与管理 6-20
    [北京]云平台与微服务架构设计 6-25
    [北京]高性能Java编程与系统性能优化 6-27
    [北京]Oracle数据库性能,架构和维护 7-2
    [北京]重构复杂遗留系统的最佳实践 7-5
    [北京]人工智能,机器学习和深度学习 7-16
    [上海]UML与面向对象分析设计 6-28
    [上海]亿级用户高并发、高可用系统架构 7-20
    [深圳]敏捷开发过程与项目管理 6-24
     讲座 持续集成平台
     讲师:俎涛
     时间:2019-7-20
     
    新华文轩  技术文档编写与评审
    某军工研究单位  软件质量管理
    某通信设备企业  嵌入式Linux内核应用开发
    某企业  软件framework设计
    西门子  UML与嵌入式软件分析设计
    北京  iOS开发技术深入研究
     
     
     

     
    每天2个文档/视频
    扫描微信二维码订阅
    订阅技术月刊
    获得每月300个技术资源
     
    希望我们的资料可以帮助你学习,也欢迎投稿&提建议给我
    频道编辑:sky
    邮       件:sky@uml.net.cn

    关于我们 | 联系我们 | 京ICP备10020922号 京公海网安备110108001071号