第一部份:初等概率论
1) 离散随机变量与离散分布
2) 连续随机变量与连续分布
3) 条件概率与贝叶斯公式
4) 马尔科夫矩阵
5) 案例:信贷违约的转移矩阵
第二部份:初等统计理论
1) 假设检验
2) 参数估计
3) 线性回归
4) 案例:性别对信贷违约的影响
第三部份:数据分析师的养成计划
1) 业务背景
2) 数据搜集与整理
3) 数据可视化与数据报表
4) 案例:信贷违约预测中的数据可视化
第四部份:python的介绍和入门
1) python语法
2) pandas,numpy,statsmodels,sklearn等常用包
3) 案例:pandas中的数据切片
第五部份:时间序列模型的应用
1) AR模型
2) MA模型
3) ARIMA模型
4) 其他常见的时间序列模型
5) 案例:从股票收益率的预测说起
第六部份:广义线性回归
1) 泊松回归
2) 逻辑回归
3) 案例:预测违约发生事件数
第七部份:分类场景之决策树与随机森林
1) 分类树的基本概念
2) 如何控制模型过拟合
3) 回归树的基本概念
4) 随机森林
5) 案例:信用卡的欺诈识别
第八部份:分类场景之支持向量机
1) 从线性可分说起
2) 对偶问题
3) 巧妙的核函数
4) 软间隔:妥协的艺术
5) SMO算法详解
6) 案例:信用卡的欺诈识别
第九部份:聚类场景之K均值聚类与K邻近聚类
1) K均值聚类:物以类聚、人以群分
2) K邻近聚类:近朱者赤、近墨者黑
3) 案例:信贷客群的聚类分析
第十部份:一统江湖之神经网络模型与深度学习模型
1) 神经网络模型的基本框架
2) 反向传播算法
3) 深度学习模型
4) TensorFlow的使用
5) 案例:信用卡的欺诈识别
第十一部份:模型性能评估
1) 回归模型的精度刻画
2) 分类模型的精度刻画
3) 案例:信用卡的欺诈识别
第十二部份:走近经典
1) EM算法
2) MCMC算法
3) 主成分分析
4) 案例:信用卡的欺诈识别模型中的降维
第十三部份:被忽视的也是最重要的
1) 数据质量检验
2) 特征工程
3) 案例:信用卡的欺诈识别 |