SPSS之logistic回归

                log(p/(1-p))=\beta_0+\beta_1x_1+\beta_2x_2+\varepsilon

SPSS使用logistic回归的步骤:

1.图形分析(条形图)

2.卡方分析(原理)

3.logistic回归分析

4.混淆矩阵分析(类似线性回归中的残差分析)

5.应用

下面将使用bankloan_binning(提取码:78uh)进行分析:

0.数据集分析---略

1.图形分析

分析y与一个x的关系:

------分类与分类

输出结果:


图中可轻易看出占比关系,违约和年龄分组存在关系

------分类与连续


均值显著不等,不相关

2.相关分析

2.1 分类与分类------卡方分析

------了解列联表

\chi^2=\sum_1^k \frac{(f_i-\overline{f_i})}{\overline{f_i}} \sim \chi^2((行数-1)(列数-1 ))



结果如下:


p值小于0.05,相关性显著

2.2 分类与连续------方差分析?


3.logistic回归分析




输出窗口为:


说明,样本数和因变量取值


可以直接跳过


0.27模型准确度有待提高


删除不显著的变量


修改后的模型(思考:β为负数怎么解释?若解释增加3000元钱呢?---e的3β次方)

4. 混淆矩阵(敏感度解释)


增加敏感度的方法:工具变量法(增加一个变量x将原本是1但被预测为0的那一行的x取值为1,其余取值为0,寻找与x高相关的特征值将他加入模型)

附加:




这个指总体预测准确率


一个应用原则:

1.回归分析通常对x不做假设

2.线性回归擅长处理连续x;logistic回归擅长处理分类x

3.统计学习模型擅长处理连续x(小数据);机器学习模型擅长处理分类x(大数据)

4.在统计学习模型中,如果需要解释x与y之间的关系,x建议分类;如果不需要解释x与y之间的关系,x建议连续;在机器学习模型中,也一样。

5.但是,在统计学习中通常不建议对x做分类;机器学习中,通常建议对x做分类。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容