参数检验
先决条件:已知总体服从正态分布(先决条件),通常总体方差也未知,推断总体均值
统计方法 |
说明 |
类型 |
统计量 |
前提 |
单样本t检验 |
推断总体均值与指定检验值之间差异是否显著 |
对总体均值的假设检验 |
t统计量 |
总体分布服从正态分布,或者样本量n较大,由中心极限定理得样本均值近似服从正态分布 |
两独立样本t检验 |
利用来自两总体的独立样本,推断两总体均值是否存在显著差异 |
总体均值检验 |
t统计量 |
总体分布服从正态分布,或者样本量n较大,由中心极限定理得样本均值近似服从正态分布 |
配对样本t检验 |
相对于两独立样本t检验,样本是相互关联的,样本量相同 |
总体均值检验 |
t统计量 |
总体分布服从正态分布,或者样本量n较大,由中心极限定理得样本均值近似服从正态分布 |
非参数检验
统计方法 |
说明 |
类型 |
思想 |
统计量 |
服从分布(小样本) |
服从分布(大样本) |
适用对象 |
卡方检验(总体分布) |
判断总体分布与期望分布是否存在显著差异 |
总体分布检验 |
基于划分子集的观测频数近似服从卡方分布 |
卡方统计量(典型:pearson卡方) |
? |
k-1自由度卡方分布 |
分类变量 |
二项分布检验 |
判断样本来自的总体是否服从指定概率值为p的二项分布 |
总体分布检验 |
小样本采用精确检验,大样本采用近似检验 |
小样本直接计算概率,大样本Z统计量(有连续性校正) |
? |
? |
二值分类变量 |
单样本KS检验 |
判断样本来自的总体是否服从某一理论分布 |
总体分布检验 |
基于拟合优度 |
KS统计量D(观测值与经验累积分布的最大绝对差值)(有修正) |
? |
根号n×D服从KS分布 |
连续型变量 |
2独立样本曼-惠特尼U检验 |
推断2个样本来自的2个总体的分布是否存在显著差异 |
总体分布检验 |
基于两样本秩和 |
曼惠特尼U统计量 |
曼惠特尼分布 |
正态分布 |
没有特指 |
多独立样本KW检验 |
推断多个样本来自的多个总体的分布是否存在显著差异 |
总体分布检验 |
方差分析思想+秩 |
KW统计量(秩组间平方和/秩总离差平方和的平均) |
KW分布 |
k-1自由度卡方分布 |
没有特指 |
2配对样本符号检验 |
推断样本来自的2个总体的分布是否存在显著差异 |
总体分布检验 |
正负号个数做二项分布检验(p是否为0.5) |
无 |
无 |
无 |
没有特指 |
2配对样本Wilcoxon检验 |
推断样本来自的2个总体的分布是否存在显著差异 |
总体分布检验 |
正负秩和统计量 |
W统计量(min正负秩和统计量) |
W统计量符合Wilcoxon符号秩分布 |
W构造的Z统计量符合正态分布 |
没有特指 |
多配对样本Friedman检验 |
推断样本来自的多个总体的分布是否存在显著差异 |
总体分布检验 |
方差分析思想 |
Friedman统计量 |
? |
k-1自由度卡方分布 |
数值型变量 |
多配对样本Cochran Q检验 |
推断样本来自的多个总体的分布是否存在显著差异 |
总体分布检验 |
方差分析思想+检验各个区组取1的概率 |
Cochran Q统计量 |
? |
k-1自由度卡方分布 |
二值变量 |
多配对样本Kendall检验 |
在Friedman检验总体分布是否一致的基础上,检验判断者的判断标准是否一致(基于协同系数W衡量组间差异程度) |
总体分布检验 |
方差分析思想 |
协同系数W |
|
k-1自由度卡方分布 |
数值型变量 |
注:1. 处理与区组:处理代表控制变量,控制变量有多少种取值,即有多少种处理水平。区组代表样本组别数量。在多配对样本中会出现这种概念。
- 方法分析思想:多因素/多样本常涉及。观测变量的总变差是由控制变量与随机变量产生的。将观测变量的离差平方和进行分解,分解为组间平方和与组内平方和,或者加上交互作用带来的离差。其中组间平方和,代表控制变量的不同水平带来的影响,组内平方和代表由于抽样误差带来的影响,最后一个是控制变量交互作用带来的影响。
- KW检验量与Friedman检验量:两者计算式相近。但前者是混合排序求秩,后者是在各个区组内排序,对每个处理水平进行求和或者求平均得到的。
方差分析
统计方法 |
说明 |
类型 |
统计量 |
服从分布 |
单因素方差分析 |
研究单个因素(的不同水平)对观测变量的影响 |
对总体均值的假设检验 |
F统计量 |
(k-1,n-k)自由度的F分布 |
多因素方差分析 |
研究多个因素的不同水平对观测变量的影响 |
对总体均值的假设检验 |
F统计量 |
? |
协方差分析 |
考虑协变量的影响,研究单/多个因素的不同水平对观测变量的影响 |
对总体均值的假设检验 |
F统计量 |
? |