Spark2.0快速入门课程的目的是让大数据初学者快速入门,目标是让想学大数据的人了解这个大数据生态圈,以及Spark在大数据生态圈中的霸主地位。
该课程为Spark的基础课程。
1.会讲解到Spark学习环境的搭建
2.最基础的Linux命令的使用
3.Hadoop中分布式文件系统HDFS的使用
4.Spark中的基本概念及抽象
5.Spark程序编写的注意事项
6.Spark性能优化的方向
7.以及会讲解一些Spark内核和内核使用的Scala语言的知识。
8.最后以一个成都地区20160101到20161231一年PM2.5数据的监控数据作为实战项目的数据素材,以此讲解Spark2.0初阶的项目实战并以此作为基础课程的结束。
为深入学习SparkSql、Spark流处理、Spark图计算、Spark机器学习打下基础。