1、Hadoop 2.x (一)大数据基础
http://edu.51cto.com/course/course_id-6704.html
2、Hadoop 2.x (二)大数据进阶
http://edu.51cto.com/course/course_id-6705.html
3、Hadoop 2.x (三) 数据分析引擎:Hive
http://edu.51cto.com/course/course_id-6706.html
4、Hadoop 2.x (四)数据分析引擎:Pig
http://edu.51cto.com/course/course_id-6707.html
5、Hadoop 2.x(五) MapReduce实战案例集锦
http://edu.51cto.com/course/course_id-8288.html
6、Hadoop 2.x(六) 使用Avro实现序列化
http://edu.51cto.com/course/course_id-8978.html
7、Hadoop 2.x (七):工作流引擎Oozie
http://edu.51cto.com/course/10353.html
建议学员从第一门课程开始,逐步学习;并完成相应的实验,这样可以更好的理解和掌握Hadoop的体系结构。
第一章 课程概述
(*)课程概述
(*)准备实验数据
(*)MapReduce基础知识回顾
第二章 案例一:使用MRUnit进行单元测试
(*)使用MRUnit测试Mapper
(*)使用MRUnit测试Reducer
(*)使用MRUnit测试MapperReducer
第三章 案例二:数据去重
(*)一个列的数据去重
(*)多个列的数据去重
第四章 案例三:数据排序
(*)基本数据类型的排序
(*)一个列的排序
(*)多个列的排序
第五章 案例四:每个部门的平均工资
(*)数据的流动过程
(*)开发Mapper、Reduce程序
(*)测试
第六章 案例五:表的自连接
(*)自连接的数据的流动过程
(*)开发Mapper
(*)开发Reducer
(*)测试程序
第七章 案例六:多表查询
(*)多表查询的数据的流动过程
(*)开发Mapper
(*)开发Reducer
(*)测试程序
第八章 案例七:倒排索引
(*)倒排索引的数据的流动过程
(*)开发Mapper
(*)开发Combiner
(*)开发Reducer
(*)测试程序
-
-