在基本的统计分析过程中,选择合适的统计学方法,已经是成功了一半。那么面对得到数据,我们该如何去选择合适的统计方法呢?
区分数据属性
最简单而重要的方法,首先是对数据的属性进行判断,是计量资料(年龄多少岁,血压多少帕斯卡,身高多少cm);还是计数资料(有多少个人,多少个国家,多少个民族)。
A 计量资料
对于计量资料,是采用非参数检验还是参数检验呢?如果数据不满足正态性、方差齐性等,可以用非参数检验;当不在乎数据是否符合正态分布,也可以直接利用非参数检验,只是非参数检验的效能相比于参数检验低,犯I类错误的概率可能会高。
当计量资料为单独一组时,采用单样本t检验或单样本秩和检验(Wilcoxon);
当两组样本为独立样本进行比较时,采用两组独立样本t检验或两组独立样本秩和检验(Mann-Whitney);
当两组样本为相关样本时,采用配对样本t检验或配对样本秩和检验(Wilcoxon);
当计量资料超过2组(3组或3组以上),采用方差分析或多组独立样本秩和检验(Kruskal-Wallis)。
B 计数资料
计数资料主要以列联表形式存在,所以对计数资料的分析,首要任务是对行、列变量属性的判断。
当行变量、列变量均为无序变量时,采用卡方检验;
当行变量或列变量为有序变量时,采用秩和检验;
当行变量、列变量均为有序变量时,可采用Spearman相关性分析量变量之间的秩相关;若是评判两种方法或处理手段的一致性,可采用Kappa分析。
将上面的长篇废话转化成图表,思路是不是更清晰了呢?
转自’医学统计园’。