分布式系统介绍 |
- 分布式存储系统:HDFS
- 分布式计算系统:MapReduce
- 海量数据分析系统:Hive
- 分布式协调系统:Zookeeper
- 分布式实时读写数据存储系统:HBase
- 工作流调度系统:Ooize
|
Hadoop系统部署实际操作
|
- 选择合适的Hadoop版本
- 分布式部署Hadoop
- 系统校验
|
分布式程序(MapReduce)开发实战 |
MapReduce编程理论 |
- 什么是MapReduce
- MR程序开发准备
- MR程序的调试
|
MapReudce编程实战
|
- CASE 1:基本MapReduce程序编写
- CASE 2:基于MapReduce的Sort操作
- CASE 3:基于MapReduce的Join操作
- CASE 3:Hadoop多语言编程框架Streaming
|
海里网站日志分析系统示例 |
|
Hive系统的部署与使用 |
Hive系统部署 |
- 搭建Hive客户端
- 搭建Hive元数据库(MySQL)
|
Hive系统使用
|
- Hive工作原理
- Hive DDL
- Hive DML
- Hive Query
|
基于列蔟的NoSQL—Hbase&Cassandra |
HBase系统理论 |
|
HBase in action |
- 编程接口
- 整合MapReduce
- 表设计方案
- HBase系统管理
|