基于Spark的大数据分析培训-火龙果软件

咨询

成功案例

相关课程

全部课程 >大数据

基于Spark的大数据分析

6248 次浏览

95 次


Willam
某世界知名企业大数据技术专家，具有电商、银行、电信多个行业大数据经验

时间地点： 北京上海深圳根据报名开班

课程费用：5000元/人

报公开课

要内训

企业内训：可以根据企业需求,定制内训,详见内训学习手册

认证方式：
培训前了解能力模型。
培训后进行能力评测：

在线考试

能力分析，给出学习建议

合格者颁发证书，作为职业技能资格证明

在本课程中，学员们将对Spark数据处理的原理，开源项目，技术方法有一个全面的了解。由于Spark与Hadoop、HBase直接的密切联系，课程对三者之间的联合使用进行了介绍。流计算作为Spark的重要扩展，也会在课程中进行介绍，此外Spark Streaming与Kafka的联合使用，也是流计算中的重要介绍部分。开源项目的社区组织、许可协议与产品发布的基本了解也极其重要，不仅仅可以规避潜在的法律风险，恰当的使用更可以显著的降低软件开发与维护成本。通过练习，还将对Spark处理的流程和方法有一个初步的实践。在单机实践之外，也会讲解集群的特性以及性能和高可用相关主题和案例分享。

培训目标：

理解并掌握Spark 整体架构设计与编程模型
能够编写并部署Spark程序与测试代码
掌握能够将kafka结合Spark streaming使用的方法
掌握Spark与HDFS、HBase的结合使用方法
理解Spark与Zookeeper结合高可用性部署方案
能够对Spark进行优化（内存、并发等）
了解在以往经验中容易出现错误的地方以及相应的解决方案
了解Spark MLlib的使用
了解Hadoop MapReduce与Spark的关系与差异

培训对象：应用开发人员，软件架构师，系统架构师

学员基础：Java基础，Linux基础

授课方式： 定制课程 + 案例讲解 + 小组讨论，60%案例讲解，40%实践演练

培训内容：2天

Spark概述	大数据起源离线分析、在线分析与流计算开源大数据包Spark概述 Spark的扩展包SQL、MLLib和GraphX 开源社区的组织结构与开源条款案例解析：一个跨国IT企业的开源包使用法务流程与风险规避
Scala编程原理	Scala：函数式编程安装Scala集成开发环境使用Scala分析北京汽车摇号结果将MapReduce程序迁移到Spark上实战练习：在本机上使用scala进行简单的spark编程
Spark Streaming流计算	Spark Streaming概述 Kafka概述基于Kafka数据源的Spark Stream练习在本机上使用scala进行简单地Spark Streaming编程，数据源使用Kafka
Spark的分布式存储	Standalone Spark集群配置 HDFS集群配置编写Scala程序访问HDFS 实战练习：在本机上使用scala进行简单的HDFS数据访问
Spark与NOSQL	NOSQL存储特征与数据格式使用Scala进行HBase数据分析示例实战练习：在本机上使用scala进行HBase数据访问
Spark与Yarn	Spark on Yarn集群配置 Spark on Yarn与standalone相比的优势案例分析：某巨型互联网公司基于Spark on Yarn的超大规模集群部署案例分析
Spark与MapReduce	Spark计算模型和MapReduce的对比 Spark与MapReduce的相同点 Spark与MapReduce的差异
Spark性能	Spark资源调度方法 CPU、内存、网络与存储配置对性能的影响及常用调优参数案例解析：一个跨国IT企业的spark集群构建方法与参数选择
Spark与MLlib	机器学习的常用算法使用Spark MLlib实现机器学习算法
Spark与ZooKeeper	通过ZooKeeper实现Spark高可用架构
Spark的案例	一个基于Spark与Hadoop的实时分析系统架构设计与实现—某银行的大数据体系介绍以及spark在其中扮演的角色方案设计分析算法确定分析算法与数据流设计技术实现演示

报公开课

要内训

6248 次浏览

95 次

其他人还看了课程

深入浅出学Zookeeper 5879 次浏览

数据湖架构原理与应用 4192 次浏览

Scala编程语言 5386 次浏览

基于Hadoop大数据平台数据治理 6583 次浏览

大数据分析设计与建模 5923 次浏览

基于模型的数据治理与数据中台建设 15723 次浏览

大数据平台规划与设计-搜索与异地容灾 5984 次浏览

	咨询服务：数据库设计与性能优化

咨询目标	对客户的数据库进行性能评价，设计优化，管理优化
咨询范围	数据库性能评价，数据库结构优化，数据访问SQL优化。
咨询方式	现有数据库调查，问题诊断，性能评价。对数据库进行逻辑结构优化，对数据库进行访问SQL优化。建立数据库运行监控平台。运行监控与优化方法指导。
成功案例	建设银行，中国农业银行，中国工商银行，中航信

详情咨询：010-62670969， zhgx@uml.net.cn

课程计划

UAF架构体系与实践 7-23[北京]

SysML和EA系统设计与建模 7-16[深圳]

Spec 驱动开发(SDD)实战 7-28[北京]

AI辅助软件测试方法与实践 7-31[在线]

AI智能体开发技术实践 8-6[上海]

基于UML和EA系统分析设计 8-20[上海]