求知 文章 文库 Lib 视频 Code iProcess 课程 认证 咨询 工具 火云堂 讲座吧   成长之路  
会员   
 
 
 
全部课程 | 技术学院 | 管理学院 | 嵌入式学院 | 在线学院  
成功案例   品质保证  电话 English
追随技术信仰

随时听讲座
每天看新闻
 
   
成功案例
某金融公 Mysql集群与性
知名某信 NoSQL缓存数据
财政部唯 大数据分析专题-R
神龙汽车 大数据技术平台-H
中国电信 大数据时代与现代企
某知名银 大数据分析专题-R
IGT 数据分析与挖掘

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >人工智能  
强化学习及案例实践
31 次浏览  1 次
Aaron
人工智能创业企业创始人.
 
时间地点: 北京 上海 深圳根据报名开班
课程费用:5000元/人
 
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。这几年随着人工智能的应用增加,强化学习逐渐走入人们的视野,本次培训将从实践与原理的角度,对强化学习进行深刻的剖析。

    培训目标:
    • 了解强化学习基础原理与应用
    • 能够熟悉强化学习的基本算法与Q-Learing,Saras,Deep-Q-Network等
    • 能够实现基础的强化学习模型设计
    • 理解马尔科夫模型
    • 熟悉DRL理论
    培训对象:
      1.对强化学习感兴趣的人员,大数据研究人员,人工智能程序员,算法工程师
      2.机器学习算法研究员
      3.强化学习研究员
      4.机器学习算法研究员
    学员基础:了解人工智能基础知识,了解机器学习算法原理
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练

    培训内容:2天

    强化学习基础
    1.马尔科夫决策过程
    • 马尔科夫决策过程理论讲解
    • MDP中的概率学基础
    • 基于GYM的MDP实例讲解
    2. 强化学习基础概念介绍
    3. 强化学习应用案例介绍:
    • 库存优化
    • 用户行为学习
    • 推荐
    • 交易策略评价等
    4. 打造强化学习开发工具箱
    • TensorFlow
    • Keras
    • Anaconda
    • XGboost等
    5. Keras简介
    • 序列模型
    • 函数式模型
    6. 单智力体强化学习
    • 马尔科夫决策过程
    • Q函数
    • 贪婪算法
    • Sarsa算法
    • Q-Learning
    • Deep Q Network算法
    7. 上机案例实践:使用Sarsa算法处理金币问题
    8. 上机案例实践:使用Q Learning算法处理金币问题
    9. 上机案例实践:使用DQN算法处理CartPole问题
    10. Keras-rl简介
    • Keras-rl智能体介绍
    • Keras-rl智能体通用API
    • Keras-rl常用对象
    11. 案例:在Keras-rl下使用SARSA算法处理CartPole问题
    12. 案例:在Keras-rl下使用DQN算法处理CartPole问题
    13.案例:在Keras-rl下使用DQN算法玩Atari游戏
    强化学习进阶与实践 1.OpenAI Gym
    • OpenAI
    • OpenAI Gym
    • Hello World OpenAI Gym
    • 案例实践:Gym环境使用
    2. 恶意程序检测
    • PE文件格式概述
    • PE文件的节
    • PE文件的特征分析
    • PE文件节的特征
    • 检测模型
    3. 智能提升恶意程序检测能力
    • Gym Malware介绍
    • Gym Malware架构
    • PEFeatureExtractor
    • Interface
    • MalwareManipulator
    • DQNAgent
    • MalwareEvn
    4. 智能提升垃圾邮件检测能力
    • 垃圾邮件技术介绍
    • 垃圾邮件绕过技术
    • Gym-Spam架构
    • DQNAgent设计
    • Env设计
     
    31 次浏览  1 次
    其他人还看了课程
    机器学习应用实践  587 次浏览
    机器学习和数据挖掘课程  562 次浏览
    强化学习及案例实践  31 次浏览
    自然语言处理(NLP)  153 次浏览
    机器学习及其matlab实现-从基础到实践  107 次浏览
    人工智能概况和前沿展望  288 次浏览
    定制内训



    最新活动计划
    [北京]Python及数据分析 11-15
    [北京]嵌入式Linux应用开发 11-20
    [北京]需求分析与管理 11-29
    [北京]人工智能机器学习和深度学习 11-26
    [上海]嵌入式软件可靠性设计 12-19
    [上海]人工智能机器学习和深度学习 11-22
    [深圳]深度学习&Tensorflow框架 12-3
    [深圳]数据仓库多维建模方法与应用 11-24
    [深圳]嵌入式软件架构设计高级实践 12-3
     
     
     

     
    每天2个文档/视频
    扫描微信二维码订阅
    订阅技术月刊
    获得每月300个技术资源
     
    希望我们的资料可以帮助你学习,也欢迎投稿&提建议给我
    频道编辑:sky
    邮       件:sky@uml.net.cn

    关于我们 | 联系我们 | 京ICP备10020922号 京公海网安备110108001071号