1. Wilcoxon Signed-rank test
前提:若数量型匹配(成对)样本观测值若成对称分布,可以用Wilcoxon检测两个总体中位数差异
目标:检测差值成对称分布的两个总体中位数是否有差异:
(1) 给定N对样本观测值,其中一个来自总体1,一个来自总体2
(2) 对两总体中位数之差进行检测,
H0: 总体1中位数-总体2中位数=0 , H1:总体1中位数-总体2中位数≠0
(3) 计算每对差值
(4) 以差值绝对值顺序得到秩(rank)
(5) 以差值符号作为秩的符号,得到符号秩
(6) 所有正的符号秩之和为随机变量, 计算得值为, 作为随机变量服从,
, n>= 10
(7) ,
,
, (8). p-value<α, 拒绝H0(中位数有差异),否则无法拒绝H0。
2. Mann-Whitney-Wilcoxon test
前提:数量型、顺序型数据,不需要假定总体服从正态分布
目标:检测量总体是否有差异
(1) 给定来自总体1的n1个样本,来自总体2的n2个样本,和两个总体同一维度的观测值
(2) H0:两总体相等, H1:两总体有差异, 指定显著性水平α的值
(3) 将全部样本混合,排序,得到每个样本的秩,同序采用平均秩值
(4) 分别计算两个总体的样本秩和R1、R2, 以总体1样本集的秩和作为检验统计量W
(5) 当两个样本容量都大于或等于7时,W的抽样分布可以用正态分布近似,即W ~,
(6).
(7). 若p-value<α,拒绝H0(两总体有差异), 否则不能拒绝H0
若量总体形态相同,MWW可用于两总体中位数差异的双侧、单侧检验,
即H0:中位数1- 中位数2=0, H1:中位数1-中位数2≠0。
3. 克鲁斯卡尔--沃利斯检验
前提:数量型、顺序型数据,不需要假定总体服从正态分布
目标:对K个总体的K个独立随机样本集的分析
(1) 来自K个总体的K个独立随机样本集的观测值
(2) H0:所有总体相同;H1:并非所有总体都相同, 指定显著性水平α
(3) 将所有数据混合排序得到所有样本值的秩,同序采用平均秩值
(4) 分别计算来自K个总体的样本秩和R1,...., Rk
(5) 计算统计量
(6) 当每个总体容量都>=5, H的抽样分布近似服从自由度为k-1的分布, 利用分布求p-value
(7) 若p-value<α,拒绝H0(k个总体不全相同), 否则不能拒绝H0
若k个总体形态相同,可用于k个总体中位数是否相同的检测。
4. 秩相关 Spearman rank-correlation coefficient (相关性检测)
目标:两个变量的相关关系是否显著的检测
(1) 对两个变量分别排序得到每个样本每个变量值的秩;
(2) 计算样本集两个变量的Spearman 秩相关系数, , 推断总体变量1和变量2的相关秩为;
(3) H0: , 确定显著性水平α;
(4) 当n>=10时,的抽样分布近似服从;
(5) , ;
(6) 若p-value<α,拒绝H0(即总体的变量1与2显著相关), 否则不能拒绝H0。