求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   Code  
会员   
 
 
 
开班计划 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导  
 电话 English
成功案例   品质保证
成功案例
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘
某航天科 MySQL性能优化

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >人工智能  
强化学习及案例实践
2797 次浏览  52 次
Aaron
人工智能创业企业创始人.
 
时间地点: 北京 上海 深圳根据报名开班
课程费用:5000元/人
报公开课  
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。这几年随着人工智能的应用增加,强化学习逐渐走入人们的视野,本次培训将从实践与原理的角度,对强化学习进行深刻的剖析。

    培训目标:
    • 了解强化学习基础原理与应用
    • 能够熟悉强化学习的基本算法与Q-Learing,Saras,Deep-Q-Network等
    • 能够实现基础的强化学习模型设计
    • 理解马尔科夫模型
    • 熟悉DRL理论
    培训对象:
      1.对强化学习感兴趣的人员,大数据研究人员,人工智能程序员,算法工程师
      2.机器学习算法研究员
      3.强化学习研究员
      4.机器学习算法研究员
    学员基础:了解人工智能基础知识,了解机器学习算法原理
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练

    培训内容:2天

    强化学习基础
    1.马尔科夫决策过程
    • 马尔科夫决策过程理论讲解
    • MDP中的概率学基础
    • 基于GYM的MDP实例讲解
    2. 强化学习基础概念介绍
    3. 强化学习应用案例介绍:
    • 库存优化
    • 用户行为学习
    • 推荐
    • 交易策略评价等
    4. 打造强化学习开发工具箱
    • TensorFlow
    • Keras
    • Anaconda
    • XGboost等
    5. Keras简介
    • 序列模型
    • 函数式模型
    6. 单智力体强化学习
    • 马尔科夫决策过程
    • Q函数
    • 贪婪算法
    • Sarsa算法
    • Q-Learning
    • Deep Q Network算法
    7. 上机案例实践:使用Sarsa算法处理金币问题
    8. 上机案例实践:使用Q Learning算法处理金币问题
    9. 上机案例实践:使用DQN算法处理CartPole问题
    10. Keras-rl简介
    • Keras-rl智能体介绍
    • Keras-rl智能体通用API
    • Keras-rl常用对象
    11. 案例:在Keras-rl下使用SARSA算法处理CartPole问题
    12. 案例:在Keras-rl下使用DQN算法处理CartPole问题
    13.案例:在Keras-rl下使用DQN算法玩Atari游戏
    强化学习进阶与实践 1.OpenAI Gym
    • OpenAI
    • OpenAI Gym
    • Hello World OpenAI Gym
    • 案例实践:Gym环境使用
    2. 恶意程序检测
    • PE文件格式概述
    • PE文件的节
    • PE文件的特征分析
    • PE文件节的特征
    • 检测模型
    3. 智能提升恶意程序检测能力
    • Gym Malware介绍
    • Gym Malware架构
    • PEFeatureExtractor
    • Interface
    • MalwareManipulator
    • DQNAgent
    • MalwareEvn
    4. 智能提升垃圾邮件检测能力
    • 垃圾邮件技术介绍
    • 垃圾邮件绕过技术
    • Gym-Spam架构
    • DQNAgent设计
    • Env设计
       
    2797 次浏览  52 次
    其他人还看了课程
    使用ROS2开发机器人应用  1885 次浏览
    大语言模型(LLM)Fine Tune  1444 次浏览
    ChatGPT实战应用  881 次浏览
    强化学习及案例实践  2797 次浏览
    自然语言处理(NLP)  3880 次浏览
    机器学习及其matlab实现-从基础到实践  1926 次浏览
    定制内训


    最新活动计划
    软件测试架构师 9-19[线上]
    QT应用开发 9-24[北京]
    Python、数据分析与机器学习 9-20[线上]
    鸿蒙和欧拉操作系统的项目应用 9-19线上]
    UAF架构体系与实践 9-26[北京]
    MBSE(基于模型的系统工程)9-27[上海]