SPSS之线性回归

使用spss做回归分析业务处理的主要步骤:

1.观察散点图--(可观察主体模式---椭圆?,趋势,异常值)

2.做相关分析-----回归的风向标

3.做回归分析-----相关指标的解读(R^2以及回归系数等)

4.残差分析(R^2的对立面)------主要分析残差的正态情况,异常,异方差

5.应用:归因分析和预测

下面以performance案例为例,讲解SPSS做线性回归的一般步骤:

0.拿到一组数据先对其行列进行分析


y的基本特点(不一定都具备):1.存在预测误差;2.获取成本高;3.较为抽象;4.业务增益;5.业务危机;6.处于业务后端------与业务相关

该数据集为182行为小数据,适合使用统计方法进行分析


1.画散点图


第一步


第二步


散点图---有图中可以看出呈现明显正相关的趋势(其他变量画图类似)

2.相关分析

原理:低维情况下不相关,高维情况下也不相关;低维情况下相关,高维下不一定相关



结果图---0.1以内可以删除,0.1-0.3为低相关

3.回归分析



输出结果如下四张图


此图表明x和y


R方为平方,0.5以上就为高度相关


第三个表为方差分析的结果, 主要看F和sig值两个,F值为方差分析的结果,是一个对整个回归方程的总体检验,指的是整个回归方程有没有使用价值(与随机瞎猜相比),其F值对应的Sig值小于0.05就可以认为回归方程是有用的。另外,从F值的角度来讲:F的值是回归方程的显著性检验,表示的是模型中被解释变量与所有解释变量之间的线性关系在总体上是否显著做出推断。若F>Fa(k,n-k-1),则拒绝原假设,即认为列入模型的各个解释变量联合起来对被解释变量有显著影响,反之,则无显著影响。


系数表格列出了自变量的显著性检验结果(使用单样本T检验),最后一列为T检验的sig,表中均小于0.05,说明自变量对因变量具有显著影响,B表示各个自变量在回归方程中的系数,负值表示IPGF这个自变量对因变量有显著的负向影响,但是由于每个自变量的量纲和取值范围不同,基于B并不能反映各个自变量对因变量影响程度的大小,这时候我们就要借助标准系数。------根据P值从大到小逐步删除特征值(也可用后退的方式进行回归)

4.残差分析

残差分析(residual analysis)就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰 。用于分析模型的假定正确与否的方法。所谓残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,σ2)。(δ-残差的均值)/残差的标准差,称为标准化残差,以δ*表示。δ*遵从标准正态分布N(0,1)。实验点的标准化残差落在(-2,2)区间以外的概率≤0.05。若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归线拟合。显然,有多少对数据,就有多少个残差。

其内容一般包括:异常值检验、方差齐性检验、误差的正态性检验、相关性检验以及相伴随的方差稳定化变换,正态化变换等修正方法.


异常值检验和误差的正态性检验


相关性与异常点检验

5.回归的应用

5.1 归因分析


在既定关系不变的情况下职能提升一分,管理能力提升0.363分

5.2 预测分析

通过较易获得未来值x来预测较难预测未来值的x





©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容