求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   Code  
会员   
 
 
 
开班计划 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导 | 角色培养  
 电话 English
成功案例   品质保证
成功案例
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘
某航天科 MySQL性能优化

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >大数据  
大数据平台架构与应用实战
4033 次浏览  55 次
赵老师
曾任京东大数据学院首席大数据技术专家
 
时间地点:在线 上海 深圳根据报名开班
课程费用:5800元/人
报公开课  
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


    在“互联网+”时代下大数据是企业的核心资产,大数据技术平台是大数据应用的核心支撑系统,掌握大数据项目解决方案以及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考,可以为企业在利用大数据方面体现出自身价值。本课程帮助学员全面掌握业界最流行高性能大数据处理系统Hadoop与Spark大数据技术体系,包括大数据高性能处理平台架构设计与项目选型规划、大数据分布式存储管理技术、NoSQL与NewSQL分布式数据库技术、大数据仓库与统计机器学习技术、大数据分析挖掘与商业智能(BI)技术、大数据实时处理技术、大数据离线处理技术、流式数据处理技术、大数据采集技术和大数据管理技术的原理知识和应用实战技能。学习完本课程后深入理解业界最流行的Hadoop与Spark大数据技术体系和平台应用实战,能根据给定的应用场景娴熟地运用大数据技术体系规划解决方案满足实际项目需求,部署符合生产环境要求的Hadoop大数据平台集群,熟练地掌握基于Hadoop与Spark大数据平台进行应用程序开发、集群运维管理和性能调优技巧,并通过具体的实训项目贯穿整个课程,提高学员的动手实践技能。

    培训目标:
    • 了解大数据处理平台的架构蓝图
    • 了解业界主流的大数据技术产品与项目解决方案
    • Hadoop大数据平台核心技术剖析
    • 大数据分布式存储系统原理及其应用实践
    • 大数据并行处理框架MapReduce与Yarn技术实践
    • Hadoop大数据处理高性能应用开发实践操作训练
    • HBase分布式数据库管理系统
    • 大型数据仓库Hive集群平台
    • Spark大数据实时处理平台剖析
    • 基于Spark的实时数据仓库和实时数据分析挖掘处理平台的实现机制
    • Mahout大数据分析挖掘平台
    • Flink分布式数据流处理与计算
    • Storm流式数据处理平台架构及其应用实践
    • 大数据智能化ETL操作工具以及Hadoop集群运维监控工具平台应用
    • 大数据的信息安全技术及其应用
    • 大数据平台项目应用完整实践与咨询讨论
    培训对象
    1. 大数据项目的开发工程师和运维工程师
    2. 大数据分析平台架构师
    3. 大数据挖掘处理算法应用工程师
    4. 大数据项目的规划咨询管理人员、大数据项目的售前和售后技术支持服务人员
    学员基础:有一定的计算机系统基础知识(如Linux操作系统知识)
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练
    培训内容:2天

    一、 大数据处理平台架构基础 1. 大数据的产生背景、发展历程
    2. 大数据和云计算的关系
    3. 大数据应用需求以及潜在价值分析
    4. 业界最新的大数据技术发展态势与应用趋势
    5. 大数据项目的技术选型与大数据处理系统架构设计
    6. “互联网+”时代下的电子商务、制造业、零售批发业、电信运营商、互联网金融业、网上银行、电子政务、移动互联网、教育信息化等行业应用实践与应用案例剖析
    二、 业界主流的大数据技术产品与项目解决方案 7. 国内外主流的大数据解决方案介绍
    8. 当前大数据解决方案与传统数据库方案的剖析比较
    9. Apache大数据平台方案剖析
    10. CDH大数据平台方案剖析
    11. HDP大数据平台方案剖析
    12. 开源的大数据生态系统平台剖析
    三、 Hadoop大数据平台核心技术剖析 13. Hadoop的发展历程以及产业界的实际应用介绍
    14. Hadoop大数据平台架构
    15. 基于Hadoop平台的PB级大数据存储管理与分析处理的工作原理与机制
    16. Hadoop的核心组件剖析
    四、 大数据分布式存储系统原理及其应用实践 17. 分布式文件系统HDFS的简介
    18. HDFS系统的主从式平台架构和工作原理
    19. HDFS核心组件技术讲解
    20. 基于HDFS的大型存储系统应用开发实战
    21. HDFS集群的安装、部署、配置与性能优化实践
    22. HDFS与Linux NFS3交互技术以及本地化挂载部署应用实践
    23. 分布式键值存储系统的平台架构、核心技术以及应用开发
    24. PB及大数据存储系统的项目案例分析
    五、 大数据并行处理框架MapReduce与Yarn技术实践 25. MapReduce并行计算模型
    26. MapReduce作业执行与调度技术
    27. 第二代大数据处理框架Yarn的工作原理及DAG并行执行机制
    28. MapReduce应用开发环境的部署,以及大数据并行处理应用程序开发
    29. MapReduce高级编程技巧与性能优化实践
    30. MapReduce与Yarn大数据分析处理案例分析
    六、 Hadoop大数据处理高性能应用开发实践操作训练 31. 部署与配置HDFS,熟练操作HDFS SHELL,HDFS与NFS操作,以及HDFS API开发实践
    32. 部署与配置MapReduce与Yarn及其开发实践
    33. Hadoop的Linux二次开发环境部署与配置
    七、 HBase分布式数据库管理系统 34. NoSQL数据库与NewSQL数据库技术介绍,及其在半结构化和非结构化大数据方面的应用实践
    35. HBase分布式数据库简介、数据模型以及工作原理
    36. HBase分布式数据库集群的平台架构和关键技术剖析
    37. HBase应用项目开发技巧,以及客户端开发实战
    38. HBase表设计与数据操作以及数据库管理API调用
    39. HBase集群的安装部署与配置优化
    40. ZooKeeper分布式协调服务系统的工作原理、平台架构、集群部署与配置应用实战
    41. HBase集群的运维与监控管理

    八、 HBase应用实践操作训练 42. 部署与配置HBase集群以及HBase的性能优化
    43. 部署与配置ZooKeeper分布式集群
    44. 构建HBase开发环境
    45. HBase数据库二次开发项目实践
    九、 大型数据仓库Hive集群平台 46. 基于Hadoop的大型分布式数据仓库基础知识,HIVE在行业中的数据仓库应用案例
    47. Hive大数据仓库简介以及应用介绍
    48. Hive数据仓库集群的平台体系结构、核心技术剖析
    49. Hive Server的工作原理、机制与应用
    50. Hive数据仓库集群的安装部署与配置优化
    51. Hive应用开发技巧
    52. Hive SQL剖析与应用实践
    53. Hive数据仓库表与表分区、表操作、数据导入导出、客户端操作技巧
    54. Hive数据仓库报表设计
    55. Hive JDBC与ODBC的工作原理与实现机制
    56. Hive HWI、CLI客户端操作以及UDF应用实践

    十、 Hive应用实践操作训练 57. 部署与配置HIVE集群,以及HIVE性能调优
    58. 构建HIVE开发环境
    59. HIVE数据仓库操作项目实践
    十一、 Spark大数据实时处理平台剖析 60. Spark的发展历程以及业界的实际应用介绍
    61. Spark实时大数据处理平台架构
    62. Spark RDD内存弹性分布式数据集的工作原理与机制
    63. Spark的核心组件剖析
    64. 基于Spark的实时数据仓库与实时分析挖掘处理在行业中的应用实践案例
    十二、 Spark应用实践操作训练 65. 部署与配置Spark集群,以及Spark性能调优
    66. 构建Spark开发环境
    67. Spark程序运行以及操作
    十三、 基于Spark的实时数据仓库和实时数据分析挖掘处理平台的实现机制, Spark SQL,Spark Streaming,MLib,GraphX,SparkR的应用实践 68. 内存计算模型和实时处理技术介绍
    69. Spark中各个分布式组件的处理框架及工作原理
    70. Spark SQL实时数据仓库的实现原理机制及应用实践
    71. Spark Streaming流式数据实时处理机制及应用实践
    72. Spark MLib实时机器学习算法应用实践与案例应用
    73. Spark GraphX实时图数据处理应用实践与社交网络分析应用案例
    74. SparkR的实现原理与应用实践
    75. Spark组件的应用编程开发实战
    76. Spark与Hadoop的集成解决方案实践
    十四、 Spark核心组件功能运用的实践操作训练 77. Spark SQL应用操作实训
    78. Spark Streaming应用操作实训
    79. Spark MLib应用操作实训
    80. Spark GraphX应用操作实训
    81. SparkR应用操作实训
    82. Spark与HBase集成数据分析实验实训
    十五、 Mahout大数据分析挖掘平台 83. 大数据分析挖掘技术介绍,以及行业大数据挖掘应用案例
    84 . Mahout大数据挖掘平台的体系架构和核心技术
    85 . 基于Mahout的数据分析挖掘算法应用,包括分类算法、聚类算法、关联规则挖掘算法、推荐与协同过滤分析算法、预测分析等算法的应用及其案例剖析
    86 . 基于Mahout的数据分析挖掘应用程序开发实战
    87 . 利用Mahout与Hadoop集成大数据挖掘平台应用实战
    十六、 Mahout大数据分析挖掘项目的实践操作训练 88. Mahout集群的安装部署与配置优化
    89. Mahout实现客户分析,广告分析,日志分析,规律预测,关联分析,定向推荐等应用程序的开发与应用实战
    90. Mahout性能优化与分析挖掘算法参数的优化,并结合Mahout实现交互式数据查询与分析挖掘的项目实践
    十七、 Flink分布式数据流处理与计算 91.大数据处理引擎Flink基础概念
    92.Flink体系架构
    93.Flink的部署和HA的实现。
    94.如何在Flink中实现流式处理和批处理的Demo。
    十八、 Storm流式数据处理平台架构及其应用实践 95. Storm流式处理系统的平台架构和工作原理
    96. Storm关键技术剖析
    97. Storm集群安装部署与配置优化
    98. Storm日志流数据分析项目应用实战
    99. Storm和Hadoop,Spark的应用集成项目实践
    十九、 大数据智能化ETL操作工具以及Hadoop集群运维监控工具平台应用 100. Hadoop与DBMS之间数据交互工具Sqoop导入导出数据的工作原理,以及Sqoop集群安装部署与配置
    101. Kettle集群的平台架构、核心技术工作原理以及应用案例
    102. Kettle大数据ETL工具的部署与配置,以及应用实战
    103. 利用Sqoop实现MySQL与Hadoop集群之间的数据导入导出交互程序
    104. Hadoop大数据运维监控管理系统HUE平台的安装部署与应用配置
    105. Hadoop运维管理监控系统Ambari平台的安装部署与应用配置
    106. Hadoop集群运维系统Ganglia, Nagios的安装部署与应用配置
    二十、 大数据的信息安全技术及其应用 107. “互联网+APP”背景下的信息安全遇到的挑战,以及可行的信息安全策略和案例分析
    108. 大数据隐私保护技术及其应用
    109. 大数据加密技术及其应用
    110. 大数据平台的安全认证技术及其应用
    111. 大数据平台的实时保护和监控、细粒度的数据访问审计、自动化的告警、数据级别的访问控制、数据漏洞管理,以及敏感数据的自动发现

    二十一、 大数据平台项目应用完整实践与咨询讨论 112. 根据讲师布置的实际应用案例,开展大数据完整项目部署设计和应用开发实践、大数据项目的需求分析、应用实施以及解决方案分享咨询与交流讨论
       
    4033 次浏览  55 次
    其他人还看了课程
    数据统计分析方法与工具、实践  3729 次浏览
    大数据分析-SparkR  3442 次浏览
    数据治理、数据架构及数据标准  5518 次浏览
    企业级Hadoop大数据处理最佳实践网络课  2096 次浏览
    Hadoop架构与大数据开发应用实践  2607 次浏览
    大数据落地技术系列课程  3295 次浏览
    定制内训


    咨询服务:数据库设计与性能优化
    咨询目标 对客户的数据库进行性能评价,设计优化,管理优化
    咨询范围 数据库性能评价,数据库结构优化,数据访问SQL优化。
    咨询方式 现有数据库调查,问题诊断,性能评价。
    对数据库进行逻辑结构优化,对数据库进行访问SQL优化。
    建立数据库运行监控平台。运行监控与优化方法指导。
    成功案例 建设银行,中国农业银行,中国工商银行,中航信
    详情咨询:010-62670969, zhgx@uml.net.cn
    课程计划
    QT应用开发 11-21[线上]
    C++高级编程 11-27[北京]
    LLM大模型应用与项目构建 12-26[特惠]
    UML和EA进行系统分析设计 12-20[线上]
    数据建模方法与工具 12-3[北京]
    SysML建模专家 1-16[北京]