新手用SPSS分类变量统计分析时必须知道的5点内容

最近在做在职研究生的论文时,教授要求用SPSS做数据实证分析,于是我开始了苦逼的自学之路,今天先把几点我在做二元逻辑回归结果解读的过程中遇到的几个问题用大白话列出来,希望能帮到那些像我这样统计学零基础却突然需要做统计分析的童鞋们。

1、虚拟变量

把定类变量作为因变量的时候,需要转化为SPSS能数字,比如得病为1,健康为0。这里多说一句,在统计学中,因变量还可称为被解释变量,自变量还可称为解释变量、控制变量。

2、卡方检验

做描述性统计时要做的检验。看两个变量(比如,1个因变量和1个自变量)之间的相关性的。一般只看第一行的“Pearson卡方”就可以,同样注意看“Sig”,这个值<0.05,则两个变量相关。

3、Hosmer-Lemeshow检验

做二元逻辑回归时需要看的内容。这个检验主要看模型的预测结果与实际发生情况的吻合程度的(术语叫“模型拟合度”)。如下图所示,重点看“Sig”值,这个值>0.05,说明拟合度比较好,最好的是这个值>0.1。

4、描述性统计

因变量是分类变量,做描述统计时,可以用“交叉表”的功能,展现出频度和百分比(占总样本)即可。因变量是连续变量的,做描述统计时,标准差、最大最小值、分布等都可以体现出来。还有记得交叉表也叫列联表……

5、二元逻辑回归

因变量是分类变量的,二分类(比如就是、否两种情况)用二元逻辑回归,多分类的就用多元逻辑回归。

我做的是二元逻辑回归时,在此可以多说一些。首先注意要看Hosmer-Lemeshow检验,拟合度不好的,需要调整模型。然后直接去看最后那张“方程中的变量”表格就可以了,主要看B(系数)、S.E.(标准误)、Sig(显著性)。B值,值越大,说明发生的可能性越高,“-”意味着负相关,反之,意味着正相关;S.E.越小越好,越小说明测量值越可靠;而Sig值<0.1即有显著性,更好一些的<0.05,最显著的<0.01。

后面的Exp(B)是B的指数,意义就是变量每增加一个单位,你的因变量的B会增加 Exp(B),不看也行。

先分享这么多,

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 回归,最初是遗传学中的一个名词,是由生物学家兼统计学家高尔顿首先提出来的。他在研究人类的身高时,发现高个子回归于人...
    黄成甲阅读 46,612评论 0 61
  • 因为专业的缘故,第一次看到《绝代艳后》这部电影是在大学的课堂上,当时的我完全被电影中美丽的凡赛尔宫和目不暇接的洛可...
    Mia白雪盒子阅读 14,882评论 0 1
  • 一、精进2.0的90天践行目标 1、在固化1.0早睡早起、运动的好习惯基础上,固化每天写晨间日记的习惯,而且让自己...
    xiewendy阅读 1,085评论 0 0
  • 如果你比别人坚持久一点,你一定收获多一些。都说白羊座做什么事都是三分钟热度,作为白羊座的我,我很赞同,我就是这样的...
    wuli战神阿瑞斯阅读 1,774评论 0 0

友情链接更多精彩内容