要资料 文章 文库 Lib 视频 Code iProcess 课程 认证 服务 工具 火云堂 讲座吧   成长之路  
会员   
 
 
 
全部课程 | 技术学院 | 管理学院 | 嵌入式学院 | 在线学院  
成功案例   品质保证  电话 English
追随技术信仰

随时听讲座
每天看新闻
 
   
成功案例
财政部唯 大数据分析专题-R
神龙汽车 大数据技术平台-H
中国电信 大数据时代与现代企
某知名银 大数据分析专题-R
IGT 数据分析与挖掘
某风电企 R语言数据分析
某车联网 数据分析与挖掘

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 

基于Hadoop大数据平台数据治理  
Gavin Liu
目前就职于国外著名的大数据公司
报名课程   305 次浏览    31 次 
时间地点: 北京 上海 深圳 根据报名开班
课程费用:5900/人

企业内训:可以根据企业需求,定制内训,详见 内训学习手册


本课程关注如何针对Hadoop大数据平台进行数据治理,以便更好地满足应用需求。

培训目标

  • 数据治理范围
  • 大数据在国内的运用
  • 大数据生态系统介绍
  • 统一元数据管理
  • 数据生命周期管理
  • 大数据平台安全
  • 数据湖
  • 数据分发系统
  • Think big基于Hadoop平台实战
  • 大数据BI展现工具
  • 互联网大数案例分享
  • 培训对象:大数据架构师,大数据运维工程师
    学员基础:了解大数据平台技术架构,最好具有一定运维经验
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练

    培训内容:2天

    数据治理范围
  • 数据治理面临的挑战
  • 数据的多元化
  • 数据的复杂性
  • 数据的完整性
  • 数据生命周期管理
  • 统一元数据管理
  • 数据集成方法
  • 数据安全
  • 数据湖架构
  • 基于大数据平台的数据建模
  • RMDBS数据的增量实时同步采集
  • 大数据在国内的运用
  • 大数据在国内的使用介绍
  • 离线计算框架介绍
  • 流式计算框架介绍
  • 内存计算框架介绍
  • 内存流式计算介绍
  • 大数据实时请求框架介绍
  • 大数据在证券的案例介绍
  • 大数据在银行的案例介绍
  • 大数据生态系统介绍
  • 分布式存储—HDFS
  • 分布式并行计算—MapReduce
  • 基于Hadoop的数据仓库—Hive
  • 统一元数据管理—Hcatlog
  • 集群管理工具—ambari
  • 工作流工具—Oozie
  • 数据的并行采集—Flume
  • MapReduce脚本工具—Pig
  • 与关系型数据库之间的数据迁移—Sqoop
  • 资源管理平台—Yarn
  • 数据生命周期管理—Falcon
  • 数据挖掘算法—Mahout
  • 分布式统一服务—Zookeeper
  • Hadoop安全工具—Knox
  • 流式计算框架—Storm
  • 内存计算框架—Spark
  • 数据挖掘框架—Mahout、Mllib和Graphx
  • 统一元数据管理

  • 元数据概念
  • Hadoop平台元数据处理面临的问题
  • Hcatalog介绍
  • Hcatlog原理和架构解析
  • Hive与Hcatlog关系
  • Hcatlog解决那些问题
  • Hcatlog实战
  • 元数据注册机制
  • 基于Hadoop平台元数据处理方案
  • 数据生命周期管理
  • 数据质量
  • 数据标准
  • 数据生命周期管理的重要性
  • 数据生命周期的概念
  • 开源Falcon解决那些问题<
  • Falcon架构和原理
  • Falcon实战
  • Falcon+HDFS、Hive实战
  • Falcon+Oozie实战
  • 大数据平台安全
  • Hadoop平台安全介绍
  • HDFS2.0的ACLS介绍
  • Hive安全介绍
  • Hbase基于namespace的安全介绍
  • Hadoop访问安全控制Knox
  • Knox的架构和原理
  • Knox与Kerberos介绍
  • Ranger安全工具介绍
  • Knox+Ranger整合控制Hadoop平台的安全
  • 基于Hadoop平台的数据加密
  • 数据湖
  • 数据湖概念
  • 数据湖解决那些问题
  • 数据湖架构
  • 数据的整合
  • 数据的landing zone功能
  • 离线数据管理
  • 流式数据管理
  • RDBMS全量和增量数据实时采集
  • Databus框架介绍
  • Databus功能介绍
  • Databus解决那些问题
  • 数据分发系统
  • NiFi的使用场景
  • NiFi架构和原理
  • HDFS+NiFi实战
  • 使用Nifi来跟踪数据分发
  • Think big基于Hadoop平台实战
  • 怎么快速迭代在Hadoop平台开发
  • Hadoop平台设施的方法论
  • 2个月快速基于Hadoop平台开发步骤
  • Hadoop平台开发的难点
  • Hadoop平台开的注意点
  • Hadoop平台设施的流程
  • 大数据BI展现工具
  • Pentaho开源大数据BI工具介绍
  • Talend开源大数据BI工具介绍
  • 百度Echarts插件介绍
  • 互联网大数案例分享
  • 淘宝大数据平台深度解析
  • 基于大数据平台的实时营销架构
  • 淘宝大数据推荐架构介绍
  • 大数据实时分析架构
  • 305 次浏览   31 次
    其他人还看了课程
    数据统计分析方法与工具、实践  594 次浏览
    大数据分析-SparkR  863 次浏览
    大数据落地技术系列课程  1057 次浏览
    大数据分析专题-R语言培训  1994 次浏览
    CDH Cloudera Manager管理实战与案例解析  1220 次浏览
    大数据(Hadoop、Spark、NoSQL等)的技术与实践  1077 次浏览
    定制内训


    咨询服务:大数据技术平台构建与应用
    咨询目标 帮助客户设计、规划大数据架构
    帮助客户建立大数据技术平台,
    帮助客户建立大数据分析模型
    咨询范围 大数据架构:数据结构模型,存储空间,数据分析模型
    大数据技术平台:分布式存储与计算平台,采集工具,分析工具
    大数据分析应用案例:分析模型,结果报告
    咨询方式 调查分析客户当前的数据资源和使用情况。
    为客户设计大数据架构
    搭建大数据技术平台
    建立大数据分析应用示例。
    详情咨询:010-62670969, zhgx@uml.net.cn

    最新活动计划
    [北京热门]UML和EA系统分析设计 1-20
    [北京]高级性能测试与性能分析 1-8
    [北京]开发过程中质量管理实践 1-11
    [北京特惠]电商架构看高可用架构设计1-13
    [北京]白盒测试技术与工具实践 1-18
    [北京特惠]产品经理与产品管理 1-27
    [北京]微服务架构设计与实践 3-10
    [上海]人工智能机器和深度学习1-11
    [上海特惠]UML和EA系统分析设计 1-18
    [深圳特惠]UML和EA系统分析设计 1-26
    [深圳]Hadoop大数据处理最佳实践 3-26
     
     
     

     
    每天2个文档/视频
    扫描微信二维码订阅
    订阅技术月刊
    获得每月300个技术资源
     
    希望我们的资料可以帮助你学习,也欢迎投稿&提建议给我
    频道编辑:sky
    邮       件:sky@uml.net.cn

    关于我们 | 联系我们 | 京ICP备10020922号 京公海网安备110108001071号