求知 文章 文库 Lib 视频 Code iProcess 课程 角色 咨询 工具 火云堂 讲座吧   成长之路  
会员   
 
 
 
全部课程 | 技术学院 | 管理学院 | 嵌入式学院 | 在线学院  
成功案例   品质保证  电话 English
追随技术信仰

随时听讲座
每天看新闻
 
   
成功案例
某金融公 Mysql集群与性
知名某信 NoSQL缓存数据
财政部唯 大数据分析专题-R
神龙汽车 大数据技术平台-H
中国电信 大数据时代与现代企
某知名银 大数据分析专题-R
IGT 数据分析与挖掘

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >大数据  
基于Hadoop大数据平台数据治理  
676 次浏览  54 次
Gavin Liu
目前就职于国外著名的大数据公司
 
时间地点: 北京 上海 深圳 根据报名开班
课程费用:5900/人

报线下课
企业内训:可以根据企业需求,定制内训,详见 内训学习手册



认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    本课程关注如何针对Hadoop大数据平台进行数据治理,以便更好地满足应用需求。

    培训目标

  • 数据治理范围
  • 大数据在国内的运用
  • 大数据生态系统介绍
  • 统一元数据管理
  • 数据生命周期管理
  • 大数据平台安全
  • 数据湖
  • 数据分发系统
  • Think big基于Hadoop平台实战
  • 大数据BI展现工具
  • 互联网大数案例分享
  • 培训对象:大数据架构师,大数据运维工程师
    学员基础:了解大数据平台技术架构,最好具有一定运维经验
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练

    培训内容:2天

    数据治理范围
  • 数据治理面临的挑战
  • 数据的多元化
  • 数据的复杂性
  • 数据的完整性
  • 数据生命周期管理
  • 统一元数据管理
  • 数据集成方法
  • 数据安全
  • 数据湖架构
  • 基于大数据平台的数据建模
  • RMDBS数据的增量实时同步采集
  • 大数据在国内的运用
  • 大数据在国内的使用介绍
  • 离线计算框架介绍
  • 流式计算框架介绍
  • 内存计算框架介绍
  • 内存流式计算介绍
  • 大数据实时请求框架介绍
  • 大数据在证券的案例介绍
  • 大数据在银行的案例介绍
  • 大数据生态系统介绍
  • 分布式存储—HDFS
  • 分布式并行计算—MapReduce
  • 基于Hadoop的数据仓库—Hive
  • 统一元数据管理—Hcatlog
  • 集群管理工具—ambari
  • 工作流工具—Oozie
  • 数据的并行采集—Flume
  • MapReduce脚本工具—Pig
  • 与关系型数据库之间的数据迁移—Sqoop
  • 资源管理平台—Yarn
  • 数据生命周期管理—Falcon
  • 数据挖掘算法—Mahout
  • 分布式统一服务—Zookeeper
  • Hadoop安全工具—Knox
  • 流式计算框架—Storm
  • 内存计算框架—Spark
  • 数据挖掘框架—Mahout、Mllib和Graphx
  • 统一元数据管理

  • 元数据概念
  • Hadoop平台元数据处理面临的问题
  • Hcatalog介绍
  • Hcatlog原理和架构解析
  • Hive与Hcatlog关系
  • Hcatlog解决那些问题
  • Hcatlog实战
  • 元数据注册机制
  • 基于Hadoop平台元数据处理方案
  • 数据生命周期管理
  • 数据质量
  • 数据标准
  • 数据生命周期管理的重要性
  • 数据生命周期的概念
  • 开源Falcon解决那些问题<
  • Falcon架构和原理
  • Falcon实战
  • Falcon+HDFS、Hive实战
  • Falcon+Oozie实战
  • 大数据平台安全
  • Hadoop平台安全介绍
  • HDFS2.0的ACLS介绍
  • Hive安全介绍
  • Hbase基于namespace的安全介绍
  • Hadoop访问安全控制Knox
  • Knox的架构和原理
  • Knox与Kerberos介绍
  • Ranger安全工具介绍
  • Knox+Ranger整合控制Hadoop平台的安全
  • 基于Hadoop平台的数据加密
  • 数据湖
  • 数据湖概念
  • 数据湖解决那些问题
  • 数据湖架构
  • 数据的整合
  • 数据的landing zone功能
  • 离线数据管理
  • 流式数据管理
  • RDBMS全量和增量数据实时采集
  • Databus框架介绍
  • Databus功能介绍
  • Databus解决那些问题
  • 数据分发系统
  • NiFi的使用场景
  • NiFi架构和原理
  • HDFS+NiFi实战
  • 使用Nifi来跟踪数据分发
  • Think big基于Hadoop平台实战
  • 怎么快速迭代在Hadoop平台开发
  • Hadoop平台设施的方法论
  • 2个月快速基于Hadoop平台开发步骤
  • Hadoop平台开发的难点
  • Hadoop平台开的注意点
  • Hadoop平台设施的流程
  • 大数据BI展现工具
  • Pentaho开源大数据BI工具介绍
  • Talend开源大数据BI工具介绍
  • 百度Echarts插件介绍
  • 互联网大数案例分享
  • 淘宝大数据平台深度解析
  • 基于大数据平台的实时营销架构
  • 淘宝大数据推荐架构介绍
  • 大数据实时分析架构
  •  
    676 次浏览  54 次
    其他人还看了课程
    大数据(Hadoop、Spark、NoSQL等)的技术与实践  1567 次浏览
    大数据(Hadoop、Spark、NOSQL)案例分析与实践  2335 次浏览
    Spark大数据处理案例分析与实践  4000 次浏览
    基于Spark的大数据分析  1173 次浏览
    Apache Kylin平台应用与实操  520 次浏览
    大数据工具Flume&Kafka集成实践  479 次浏览
    定制内训


    咨询服务:大数据技术平台构建与应用
    咨询目标 帮助客户设计、规划大数据架构
    帮助客户建立大数据技术平台,
    帮助客户建立大数据分析模型
    咨询范围 大数据架构:数据结构模型,存储空间,数据分析模型
    大数据技术平台:分布式存储与计算平台,采集工具,分析工具
    大数据分析应用案例:分析模型,结果报告
    咨询方式 调查分析客户当前的数据资源和使用情况。
    为客户设计大数据架构
    搭建大数据技术平台
    建立大数据分析应用示例。
    详情咨询:010-62670969, zhgx@uml.net.cn

    最新活动计划
    [北京]软件测试方法与实践 12-17
    [北京]UML和EA进行系统分析设计 1-10
    [北京]软件设计模式最佳实践 12-20
    [北京]大数据分析与管理 1-17
    [上海]嵌入式软件可靠性设计 12-19
    [上海]Kubernetes构建企业容器云 12-21
    [深圳]数据仓库多维建模方法应用 12-29
     
     
     

     
    每天2个文档/视频
    扫描微信二维码订阅
    订阅技术月刊
    获得每月300个技术资源
     
    希望我们的资料可以帮助你学习,也欢迎投稿&提建议给我
    频道编辑:sky
    邮       件:sky@uml.net.cn

    关于我们 | 联系我们 | 京ICP备10020922号 京公海网安备110108001071号