方差分析是根据样本方差对总体均值进行统计推断的方法,能够解决多个均值是否相等的检验问题。方差分析有两个优点: 一是效率较高,节省了时间:二是增加了稳定性,因为分析将所有的样本资料结合在了一起.
实验基本原理
方差分析的目的是检验各个水平的均值是否相等,实现这个目的的手段是通过方差的比较。观察值之间的差异来自于两个方面:一个是由不同水平造成的系统性差异,另一个是由抽选样本的随机性而产生的差异。这两个方面产生的差异可以用两个方差来衡量: 一个称为水平之间的方差,是由系统性因素和随机性因素共同造成的;另一个称为水平内部的方差, 仅由随机性因素造成。如果不同的水平对结果没有影响,则在水平之间的方差中, 仅仅有随机因素的差异,而没有系统性的差异,所以两个方差的比值应接近于1 ;反之,则两个方差应差异较大。
1. 单因素方差分析
oneway sales color, tabulate
sales (销量)是将要分析的变量, color 是分类变量,也就是水平变量, tabulate 的作用
是产生有关数据的汇总表.
2.多因素方差分析
在现实研究中, 一个事件不可能仅受一个因素的影响,恰恰相反, 一个事件是受多个因素综合作用的结果,所以多因素方差分析相比单因素方差分析有更广泛的应用空间。下面以双因素方差分析中无交互作用的情况为例
anova wage child rnarriage child * rnarriage
anova 是进行多因素方差分析的命令语句, wage 是因变量, child 、marriage 和child* marriage 是影响因素,
- 协方差分析
方差分析存在明显的弊端,因此无法控制分析中存在的某些随机因素,这也影响了分析结果的准确度。
协方差分析控制了这些干扰或调节因素,提高了试验的精确性和准确性,对处理以外的 一切条件都采取了有效措施来严加控制,使它们在各个处理过程中尽量保持一致。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法。
协方差分析将那些难以控制的因素作为协变量,从而在排除协变量影响的情况下,分析自变量、因变量的作用。当模型中只存在一个协变量时,叫做一元协方差分析,当有两个及以上的协变量时,叫做多元协方差分析。
协方差分析的基本命令语句与多因素方差分析的命令语句基本一致,这个命令语句与多因素方差分析命令语句的唯一不同是" continuous(varli st) " ,即必须指明连续变量,若不指明, Stata 默认除因变量之外的所有变量均为分类变量:
anova wage child marriage child * marriage educ, continuous(educ)
通过实验原理,我们知道协方差分析是借助回归分析完成的,所以可以通过添加regress选项的形式便回归的结果得到展示,使变量间的关系得到更清晰的展现,这时的命令语句如下:
anova wage ch 工ld marriage child * marriage educ , continuous(educ) regress
参考:
《stata统计分析与应用》第二版 周光肃等著