其实按照正常的统计学教学大纲,t检验之后应该是学习方差分析的内容,但我之前也说过,既然咱们学习了t检验的使用,对于不满足t检验使用条件的情形该怎么办,咱也不能不会。所以今天学习的是应对t检验使用不了的场景该使用的方法-非参数检验。
什么叫非参数检验?
非参数检验,字面意思,不是参数的检验。与之对应的当然就是参数检验,就是我们常说常用的t检验,方差分析,卡方检验等。参数检验对于总体的要求较高,比如t检验和方差分析,都要求数据满足正态,独立和方差齐这样的条件,不满足时强行使用会造成结果的不准确,影响试验的进程。
应对这样的情况,使用非参数检验或许可以很好的解决问题。非参数检验对总体的要求不高,不管是计量、计数或者是等级资料都可以使用,没有什么限制条件。之所以这样,是因为它压根也不关心原始数据是大是小,它只需要将原始数据按照大小顺序排列,分析每个数据所对应的”排名“,也就是统计书上说的“秩次”,最后得到结果。
但是,非参数检验就像广谱抗生素,虽然对众多有害细菌都有抑制作用,但效果一般,只能起到一定作用。真正想要杀灭有害细菌,必须找到与之相对应的抗生素,对症下药。意思就是说,虽然我能用非参数检验解决所有t检验下的问题,但如果数据满足t检验的使用条件,再用非参数检验只会降低自己的检验效率,有时得到的结果可能还不好。
所以我的建议是,能用参数检验就尽量使用参数检验,条件不满足尽量去想办法让其满足(比如不满足正态性,可以尝试变量变换),实在没办法再选择非参数检验。因为,非参数检验丢失的数据信息太多,仅仅使用数据秩次的检验哪有直接使用参数的检验好。
非参数检验的原理
关于非参数检验的原理,在这我就不展开讲了,不然各种公式、概念又是罗里吧嗦一大堆。有兴趣的同学可以仔细翻看教材,或者查百度,上面的解释我相信比我说的要更详细。我的主要目的是让大家会用SPSS软件去操作非参数检验,解决实际问题,而不是培养大家成为统计爱好者。
非参数检验的例子
其实听到这里,我相信有很多小伙伴依旧不是很明白非参数检验背后的逻辑,"秩次”“秩和”“秩平均"到底是个啥?概念我就不讲了,我直接举个例子方便大家理解。
我现在是一个学校的校长,我想知道初一新入学的学生男女升高是否有差异,但此时人数有300人,一个一个去量又浪费时间,此时就可用非参数检验的思想去解决这个问题。
我先将他(她)们按照身高从小到大的顺序进行排序,并且标记他们每个人的序号,身高一样的将序号除以2取平均序号(如4号和5号身高相同,那就俩人都是4.5),这个序号专业上叫“秩次”。然后告诉他们男生出列,再将所有男生的序号相加求和;女生同样如此。此时比较两个和的大小,也就是所谓的“秩和”,就能知道谁高谁低;如果人数不等,那就将和除以各组人数,取和的平均,专业上叫“秩平均”,再比大小。男生的秩平均如果远大于女生的秩平均,那男女身高就是有差异的。(手动计算的话依旧有个界值表,到底多大算差异,查表说了算。软件自动计算)
结尾
这就是非参数检验大概的含义,我们只需要明白它的浅层含义再会操作基本就够用。统计学是一门方法学科,是帮助我们解决实际问题的,它背后的公式和逻辑掌握更好,了解一点会用就足以,毕竟人人都不是统计专家,统计软件设计出来就是让我们用的,而不是学它是怎么来的。
好啦,之后的篇幅我会详细介绍每一种非参数检验的具体操作方法和使用场景,今天的原理篇就说到这。拜拜。