第一部份 Spark ML基础入门
1、Spark介绍
2、Spark ML介绍
3、部份程的基础环境
4、Spark SparkSession
5、Spark Datasets操作
6、Datasets操作的代码实操
第二部份 Spark ML Pipelines(ML管道)
1、Pipelines的主要概念
2、Pipelines实例讲解
3、ML操作的代码实操
4、使用 ML Pipeline 构建机器学习工作流案例展示
5、实例的代码实操
第三部份 Spark ML数学基础
1、ML矩阵向量计算
2、分类效果评估指标及ML实现详解
3、交叉-验证方法及ML实现详解
4、实例的代码实操
第四部份 Spark ML特征的提取、转换和选择
1、特征的提取及ML实现详解
2、特征的转换及ML实现详解
3、特征的选择及ML实现详解
4、实例的代码实操
第五部份 Spark ML线性回归/逻辑回归算法
1、线性回归算法
2、逻辑回归算法
3、ML回归算法参数详解
4、ML实例
5、实例的代码实操
第六部份 Spark ML决策树/随机森林/GBDT算法
1、决策树算法
2、随机森林算法
3、GDBT算法
4、ML树模型参数详解
5、ML实例
6、实例的代码实操
第七部份 Spark ML KMeans聚类算法
1、KMeans聚类算法
2、ML KMeans模型参数详解
3、ML实例
4、实例的代码实操
第八部份 Spark ML LDA主题聚类算法
1、LDA主题聚类算法
2、ML LDA主题聚类模型参数详解
3、ML实例
4、实例的代码实操
第九部份 Spark ML协同过滤推荐算法
1、协同过滤推荐算法
2、ML协同过滤分布式实现逻辑
3、ML协同过滤源码开发
4、实现实例
5、实例的代码实操
第十部份 大型案例:基于Spark的推荐模型开发
1、案例背景
2、架构设计
3、数据准备
4、模型训练
5、模型预测
6、脚本封装 |