使用spss做回归分析业务处理的主要步骤:
1.观察散点图--(可观察主体模式---椭圆?,趋势,异常值)
2.做相关分析-----回归的风向标
3.做回归分析-----相关指标的解读(以及回归系数等)
4.残差分析(的对立面)------主要分析残差的正态情况,异常,异方差
5.应用:归因分析和预测
下面以performance案例为例,讲解SPSS做线性回归的一般步骤:
0.拿到一组数据先对其行列进行分析
y的基本特点(不一定都具备):1.存在预测误差;2.获取成本高;3.较为抽象;4.业务增益;5.业务危机;6.处于业务后端------与业务相关
1.画散点图
2.相关分析
原理:低维情况下不相关,高维情况下也不相关;低维情况下相关,高维下不一定相关
3.回归分析
输出结果如下四张图
4.残差分析
残差分析(residual analysis)就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰 。用于分析模型的假定正确与否的方法。所谓残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,σ2)。(δ-残差的均值)/残差的标准差,称为标准化残差,以δ*表示。δ*遵从标准正态分布N(0,1)。实验点的标准化残差落在(-2,2)区间以外的概率≤0.05。若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归线拟合。显然,有多少对数据,就有多少个残差。
其内容一般包括:异常值检验、方差齐性检验、误差的正态性检验、相关性检验以及相伴随的方差稳定化变换,正态化变换等修正方法.
5.回归的应用
5.1 归因分析
5.2 预测分析
通过较易获得未来值x来预测较难预测未来值的x