SPSS建模数据分析实战之银行信用评分.
获取数据
数据可以是自己爬取,也可以是其它方式获取,不多说。
数据的特征提取和数据清洗
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116192233803.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
在SPSS Modeler 中导入数据并利用特征模型对原数据进行特征分析。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116192952361.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
可以得出重要的字段和不重要的字段。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116193045742.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
对136个重要字段进行数据审核,可以看出字段有无缺失值、异常值,。。
~~
然后对数据根据个人需求进行数据清洗。
略
分析方法:连续变量分箱方法;logistics回归;评分卡方法。
*对字段进行分享计算WOE值
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116194048632.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116194440964.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116194458832.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
建立模型
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195059204.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
导出模型方程为TXT文本
![在这里插入图片描述](https://img-blog.csdnimg.cn/2019011619532529.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
**
导出回归系数**
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195409787.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
根据之前导出的方程模型进行计算
将回归系数转化成信用评分
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195521933.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
根据上一步得出的回归系数计算各分箱评分
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195648942.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
信用模型检验
![在这里插入图片描述](https://img-blog.csdnimg.cn/2019011619575741.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116195848205.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
导出八万条客户的评分数据。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116200354328.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
可以看出K-S值最大的是267分,说明如果267分以上放贷,以下不放,可以有拒绝49.592%的坏顾客,同时也会拒绝31.247%的好客户。。
模型验证示例
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190116210726765.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5MzA0ODk2,size_16,color_FFFFFF,t_70)
到此就结束,人懒,细节的地方就不写了。因为纯属是为了学习,所以模型最后的结果不是很让人满意,但是大致上了解了SPSS Modeler 的操作。。