第一章 课程概述
1、课程概述
2、课时实验环境介绍
3、什么是数据仓库?
4、Hadoop的起源:Google的思想概述
5、Google的基本思想1:分布式文件系统GFS
6、Google的基本思想2:倒排索引
7、Google的基本思想3:PageRank
8、Google的基本思想4:BigTable
9、本讲内容总结
第二章 Hadoop 2.x HDFS的体系架构
10、HDFS体系结构之一:NameNode和DataNode
11、HDFS体系结构之二:HDFS文件上传的过程
12、HDFS体系结构之三:文件下载的过程
13、HDFS体系结构之四:示例-文件上传和下载
14、HDFS体系结构之五:SecondaryNameNode
15、HDFS体系结构之六:HDFS的瓶颈
第三章 Yarn的体系结构和MapReduce运行的过程
16、MapReduce程序在Yarn平台上的执行过程
第四章 HBase的体系结构
17、HBase的体系结构
18、HBase的表结构
第五章 Hadoop 2.x的生态圈
19、Hadoop的生态圈
第六章 Hadoop 2.x 的安装和配置
20、Hadoop的安装之一:Linux和JDK
21、Hadoop的安装之二:本地模式
22、Hadoop的安装之三:伪分布模式
23、Hadoop的安装之四:SSH免密码登录原理和配置
24、Hadoop的安装之五:Hadoop的WebConsole
第七章 Hadoop应用案例分析
25、Hadoop应用案例一:基于大数据的互联网架构
26、Hadoop应用案例二:基于Hadoop的日志分析
27、Hadoop应用案例三:Hadoop在淘宝中的应用
第八章 操作HDFS
28、HDFS体系结构知识点回顾
29、通过命令行访问HDFS
30、HDFS的Java编程案例一
31、HDFS的Java编程案例二
32、HDFS的Java编程案例三
33、本章小结
第九章 使用MapReduce程序处理数据
34、本讲概述
35、MapReduce的基本概念和原理
36、第一个MapReduce程序
37、Hadoop序列化的基本概念
38、编写Hadoop序列化的程序
39、MapReduce的排序
40、MapReduce的分区
41、什么是Combiner
42、什么是Shuffle
43、本讲总结