一、为什么要使用“协方差分析”?
在我们的研究过程中经常会出现除了关注的自变量和因变量,还有一些其他的因素也会影响因变量,但我们又不想考虑他们,这个时候就需要借助协方差分析了。比如,想研究不同教学方法的作用,那么自变量是教学方法,因变量是学生的成绩,但是我们知道学生最初的水平也对最后的成绩有影响,所以为了更好研究教学方法,我们需要采用统计的方法对学生原本的水平进行控制。
二、协方差分析需满足的假设条件及SPSS中的操作
-
1.合适的数据
因素(自变量):二分或分类变量
协变量:连续的等距或等比数据,且数据无界
因变量:连续的等距或等比数据,且数据无界
-
2.独立性假设
结果变量的每个值都应该是独立的
-
3.分布假设
在每个组内,结果变量应该近似服从正态分布。可用直方图目测,用统计方法:正态性统计检验方法(如K-S统计检验)
-
4.方差齐性假设
每个组的方差应该是近似的。统计检验:Levene统计量,若不显著,则齐性
-
SPSS:
-
结果:
-
5.协变量与自变量之间相互独立,不相关
(1)也就是协变量在自变量的不同水平之间是无差异的
(2)SPSS操作:独立样本t检验(或方差分析)
具体过程与结果见假设4
-
6.协变量与因变量之间是线性关系,且在每个组之间因变量对协变量的回归系数无显著差异
(1)线性关系可以用散点图来检验
-
SPSS:
图形→旧对话框→散点图→简单分布→Y轴(因变量)→X轴(协变量)→面板依据:行(自变量)→确定出图
双击图片→元素→总计拟合线
-
结果:
(2) 检验各组的回归系数之间是否有差异。在此需要作自变量和协变量的交互作用分析,且只看自变量和协变量之间的交互作用是否显著,如果不显著表明协变量和因变量之间的关系不会因自变量各处理水平的不同而有所差异,即因变量对协变量的回归斜率相等,满足协方差分析条件;显著则不可进行。
-
SPSS:分析→一般线性模型→单变量→(自行拖入各变量)→模型→选择“设定”→将变量及变量间交互作用放入“模型”→确定
-
结果:
在进行完上面的假设分析后就能进行作重要的协方差分析啦!
-
SPSS:分析→一般线性模型→单变量→(自行拖入各变量)→模型→选择“全因子”→确定
-
结果:
补充:
在协方差分析中,协变量的作用是用于控制实验中我们不想关注但却会对因变量产生影响的变量,而且要求协变量与自变量之间没有交互作用。
但是值得关注的是,有一种特殊情况,也就是协变量与自变量之间本身就相关,且协变量是连续变量时,这种一个情况下,协变量不再是用于被控制掉的变量,而是也变成自变量来作分析。
例子:
- 在文章中为了探究个体对厌恶情绪的态度对刺激选择偏好的影响。如果不去考虑该文章,我们可能会将态度分为积极和消极两个水平,刺激类型分为厌恶、悲伤和中性三水平,进行2(态度)x2(刺激类型)的重复测量方差分析。也就是我们将本来是连续变量的态度按照3SD的标准进行了高低分组,这样做使得中间部分是数据浪费。虽然可以这样进行分析,但是要注意,这种分组在进行最后的结果解释时只能说积极态度组和消极态度组在对厌恶情绪刺激的选择上有差异,我们不能直接按照连续变量的解释方式进行。
- 再回到该文章,为了更好运用并分析数据,可以将态度这个连续变量作为协变量(其实依旧是自变量,只是没有水平数目而已),此时的结果我们可以描述为“随着个体对厌恶态度的变化,个体选择厌恶刺激的数量也会增加(或减少)”,即从连续变量的角度进行解释。
- 这种分析方式不仅可以更全面分析数据,同时也能更好反映研究的问题。
- 但采用此方法需要较大的样本量。