SPSS使用logistic回归的步骤:
1.图形分析(条形图)
2.卡方分析(原理)
3.logistic回归分析
4.混淆矩阵分析(类似线性回归中的残差分析)
5.应用
下面将使用bankloan_binning(提取码:78uh)进行分析:
0.数据集分析---略
1.图形分析
分析y与一个x的关系:
------分类与分类


输出结果:

图中可轻易看出占比关系,违约和年龄分组存在关系
------分类与连续

均值显著不等,不相关
2.相关分析
2.1 分类与分类------卡方分析
------了解列联表


结果如下:

p值小于0.05,相关性显著
2.2 分类与连续------方差分析?

3.logistic回归分析


输出窗口为:

说明,样本数和因变量取值

可以直接跳过

0.27模型准确度有待提高

删除不显著的变量

修改后的模型(思考:β为负数怎么解释?若解释增加3000元钱呢?---e的3β次方)
4. 混淆矩阵(敏感度解释)

增加敏感度的方法:工具变量法(增加一个变量x将原本是1但被预测为0的那一行的x取值为1,其余取值为0,寻找与x高相关的特征值将他加入模型)
附加:



这个指总体预测准确率
一个应用原则:
1.回归分析通常对x不做假设
2.线性回归擅长处理连续x;logistic回归擅长处理分类x
3.统计学习模型擅长处理连续x(小数据);机器学习模型擅长处理分类x(大数据)
4.在统计学习模型中,如果需要解释x与y之间的关系,x建议分类;如果不需要解释x与y之间的关系,x建议连续;在机器学习模型中,也一样。
5.但是,在统计学习中通常不建议对x做分类;机器学习中,通常建议对x做分类。