第一天上午 |
- Scala语言介绍
- Scala语言安装
- Scala快速入门介绍
- 什么Spark
- Spark的简介
- Spark的编译
- Spark的安装
- Spark安装成功测试
|
第一天下午 |
- Spark原理
- Spark的RDD
- 什么是RDD
- RDD的种类
- Spark的存储级别
- Cache介绍
- Spark的容错原理
- Lineage容错
- Checkpoint容错
- RDD的创建
- 案例
|
第二天上午
|
- Spark调度组件
- RDD graph
- 作业与任务调度
- DAG Scheduler
- Task Scheduler
- Task细节
- Job的调度流程
- Broadcast variables介绍
- Spark的优化
- Spark的生态系统
- Spark与hadoop的比较
- Spark的使用场景介绍
|
第二天下午 |
- Spark实战一:求最大值
- Spark实战二:自定义RDD(define a new RDD)
- Spark实战三:RDD创建的种类(Scala、HDFS、localdisk
and inputformat)
- Spark实战四:基于Spark的日志分析
|