今天我们学习的内容是两个独立样本的非参数检验,这里特别声明一点,虽然标题起的是Wilcoxon秩和检验,但在SPSS实际操作中使用的却是Mann-Whitney U检验。不是写错了,而是我是按照第4版医学统计学章节写对应的操作教程,自然名称也要一致,这样方便有需要的小伙伴学习的时候可以对照教材去看原理。
SPSS中没有Wilcoxon秩和检验是因为与Mann-Whitney U检验合并所致,这一点不用纠结。SAS中是有单独Wilcoxon秩和检验的指令,感兴趣的小伙伴可以去试试。
原理:
Mann-Whitney U检验的原理在这简单说一下。
Mann-Whitney U检验等同于两组数据的Wilcoxon秩和检验和Kruskal-Wallis检验,都是检验两个样本的总体在位置上是否相等。
首先将两组样本混合并按升序排序,这样就得到了每个数据在整个数据上的位置,称为秩。如果数据在总体数据上位置一致,称为节(就是之前说过的加起来除以2)。此时计算第一个样本每个数据的秩大于第二个样本每个数据的秩的次数,记作U1;同理,记作U2。如果U1和U2接近,说明两个样本来自相同分布的总体;U1和U2差别大,那就不是。
适用:
一、原始数据的两样本比较
二、频数表资料和等级资料的两样本比较
案例演示:(选自第4版 医学统计学)
一、原始数据的两样本比较
实际操作:
注:此时得到P=0.08>0.05,可能就已经有小伙伴下两个人群无差异的结论了。先别急,咱回到题目。人家问的可不是两个人群是否有差异,而是一个是否高于一个,这明显就是个单侧检验,H1:肺癌患者的RD值>矽肺0期工人的RD值。咱们所得的P值是要除以2的!
P=0.04<0.05,拒绝H0,接受H1,肺癌患者的RD值>矽肺0期工人的RD值。
所以一定不能看到P>0.05就一股脑下结论,一定得知道自己的研究目的,所以我建议初学者一定要将每次练习例题的H0和H1写下来,以便加深理解。
二、频数表资料和等级资料的两样本比较
看到频数表资料,首先就是先加权。
和上一个例题一样,同样是单侧检验。但P值依旧是<0.05,所以拒绝H0,接受H1,吸烟工人的HbCO含量高于不吸烟工人的HbCO含量。
两个独立样本的Wilcoxon秩和检验现在就学完了,这也就完成了对于单样本和两个样本来讲,如果使用条件不满足时的应对方法。这仅仅是非参的一小部分,之后就正式开始方差分析的学习内容,同理,如果方差分析的使用条件不满足,也有对应的非参方法,到时候再说。拜拜。