在信贷风控领域,随着大数据、计算机集群技术、网络技术和人工智能的发展,越来越多的金融机构将传统的策略风控手段转向依赖机器学习模型等量化手段。信贷环节中的审批、预警、催收以及营销等诸多场景也适合机器学习模型的应用。机器学习模型的发展离不开数学、统计、概率、计算机理论等基础知识。本课程将从较为基础的统计和概率入手,展现如何从从基础知识入门进而掌握较为先进的机器学习模型,从而构建简单但实用的风控模型。
第一部份:初等概率论
1) 离散随机变量与离散分布
2) 连续随机变量与连续分布
3) 条件概率与贝叶斯公式
4) 马尔科夫矩阵
5) 案例:信贷违约的转移矩阵
第二部份:初等统计理论
1) 假设检验
2) 参数估计
3) 线性回归
4) 案例:性别对信贷违约的影响
第三部份:数据分析师的养成计划
1) 业务背景
2) 数据搜集与整理
3) 数据可视化与数据报表
4) 案例:信贷违约预测中的数据可视化
第四部份:python的介绍和入门
1) python语法
2) pandas,numpy,statsmodels,sklearn等常用包
3) 案例:pandas中的数据切片
第五部份:时间序列模型的应用
1) AR模型
2) MA模型
3) ARIMA模型
4) 其他常见的时间序列模型
5) 案例:从股票收益率的预测说起
第六部份:广义线性回归
1) 泊松回归
2) 逻辑回归
3) 案例:预测违约发生事件数
第七部份:分类场景之决策树与随机森林
1) 分类树的基本概念
2) 如何控制模型过拟合
3) 回归树的基本概念
4) 随机森林
5) 案例:信用卡的欺诈识别
第八部份:分类场景之支持向量机
1) 从线性可分说起
2) 对偶问题
3) 巧妙的核函数
4) 软间隔:妥协的艺术
5) SMO算法详解
6) 案例:信用卡的欺诈识别
第九部份:聚类场景之K均值聚类与K邻近聚类
1) K均值聚类:物以类聚、人以群分
2) K邻近聚类:近朱者赤、近墨者黑
3) 案例:信贷客群的聚类分析
第十部份:一统江湖之神经网络模型与深度学习模型
1) 神经网络模型的基本框架
2) 反向传播算法
3) 深度学习模型
4) TensorFlow的使用
5) 案例:信用卡的欺诈识别
第十一部份:模型性能评估
1) 回归模型的精度刻画
2) 分类模型的精度刻画
3) 案例:信用卡的欺诈识别
第十二部份:走近经典
1) EM算法
2) MCMC算法
3) 主成分分析
4) 案例:信用卡的欺诈识别模型中的降维
第十三部份:被忽视的也是最重要的
1) 数据质量检验
2) 特征工程
3) 案例:信用卡的欺诈识别
|