4.1
Scala语言基础,常用语法以及库函数
4.2 Spark程序设计方法
(1)DSpark程序基本构成,SparkContext, RDD,transformation/action
(2)Spark API介绍
(a)如何创建RDD (scala集合,HDFS文件,HBase文件等)
(b)如何基于RDD进行数据处理,介绍常见的分布式算子
(c)如何保存处理结果 (返回到driver端,写入hdfs等)
(d)广播变量与累加器
4.3 Spark程序设计实例
(1)分布式Pi估算程序
(2)K-means分类算法实现
(3)逻辑回归算法实现 |