一、方差分析
1. 什么是方差分析?
方差分析又称“F检验”,用于两个及两个以上样本均数差别的显著性检验。方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
根据研究中自变量X的不同,方差分析又可以进行细分。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。
2. 方差分析分类(单因素/双因素/多因素方差分析)
单因素方差分析: 用于分析定类数据与定量数据之间的关系情况。在使用单因素方差分析时,需要每个选项的样本量大于30,比如男性和女性样本量分别是100和120,如果出现某个选项样本量过少时应该首先进行组别合并处理,比如研究不同年龄组样本对于研究变量的差异性态度时,年龄小于20岁的样本量仅为20个,那么需要将小于20岁的选项与另外一组(比如20~25岁)的组别合并为一组,然后再进行单因素方差分析。
双因素方差分析: 用于分析定类数据(2个)与定量数据之间的关系情况,例如研究人员性别,学历对于网购满意度的差异性;以及男性或者女性时,不同学历是否有着网购满意度差异性;或者同一学历时,不同性别是否有着网购满意度差异性。
多因素方差分析: 通常用于类实验式问卷研究。比如研究者测试某新药对于胆固醇水平是否有疗效;研究者共招募72名被试,男女分别为36名,以及男女分别再细分使用新药和普通药物;同时高血压患者对于新药可能有干扰,因而研究者将被试是否患高血压也纳入考虑范畴中。因而最终,X共分为三个,分别是药物(旧药和新药)、性别,是否患高血压;Y为胆固醇水平。因而需要进行三因素方差分析即多因素方差分析。
二、t检验
1. 什么是t检验?
t检验,主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
2. t检验分类(独立样本/配对样本/单样本t检验)
T检验共分为三种方法,分别是独立样本T检验,配对样本T检验和单样本T检验。
独立样本T检验:独立样本T检验比较两组选项的差异,比如男性和女性。相对来讲,独立样本T检验在实验比较时使用频率更高,尤其是生物、医学相关领域。
独立样本T检验和配对样本T检验功能上都是比较差异,而且均是比较两个组别差异。但二者有着实质性区别,如果是比较不同性别,婚姻状况(已婚和未婚)样本对某变量的差异时,应该使用独立样本T检验。如果比较组别之间有配对关系时,只能使用配对样本T检验,配对关系是指类似实验组和对照组的这类关系。另外独立样本T检验两组样本个数可以不相等,而配对样本T检验的两组样本量需要完全相等。
单样本T检验。这里用一个例子来说明,比如问卷某题项选项表示为1分代表非常不满意,2分代表比较不满意,3分代表一般,4分代表比较满意,5分代表非常满意,当想分析样本对此题项的态度是否有明显的倾向,比如明显高于3分或者明显低于3分时,即可以使用单样本T检验。单样本T检验是比较某个题项的平均得分是否与某数字(例子是与3进行对比)有着明显的差异,如果呈现出显著性差异,即说明明显该题项平均打分明显不等于3分。此分析方法在问卷研究中较少使用,平均得分是否明显不为3分可以很直观的看出,而不需要单独进行检验分析。
三、什么时候用方差分析,什么时候用t检验?
t检验适用于两列数据的均值比较。
单因素方差分析适用于两列或更多列数据的均值比较。
但对于两列数据的均值比较,单因素方差分析=等方差假设的双尾t检验。
推荐使用方差分析,同时不排斥T检验的方法。但无论选用哪种方法,都应当在论文中明确标注选用的统计方法。
事实上,无论是T检验还是方差分析,它们都涉及到了方差齐性假设,即样本满足正态分布。采用方差分析,可以使用高风险的假设以获得高收益。T检验,可以使用低风险的假设以获得低收益。简单说,就是方差分析的检验效能更高,可能方差分析的没有统计学差异的结果,在T检验中会出现差异。简言之,多组找差异,直接选择方差分析。
参考:
①原文作者:SPSSAU(知乎),链接:什么时候用t检验、什么时候用方差分析? - 知乎 (zhihu.com)
②原文作者:柯基不会飞,链接:方差分析 VS T检验 - 知乎 (zhihu.com)