关于ANOVA(方差分析)的定义:
不同处理组的均数间的差别基本来源有两个:实验条件和随机误差。
- 实验条件所带来的误差,成为组间差异(between),用变量在各组的均值与 总均值之偏差平方和总和(SSb)表示,自由度为dfb;
- 随机误差,称为组内误差(within),用变量在各组的均值与该组内变量值之偏差平方和(SSw)表示,自由度为dfw(即:n-m)。
- n为样本总数,m为组数,SSw/(n-m)=MSw(均方),SSb/(m-1)=MSb,若处理没有作用,则MSb约等于MSw; 若处理有作用,则MSb远远大于MSw, MSb/MSw比值构成F分布,若F值接近于1,则各组均值间的差异没有统计学意义,若远远>1,则有。
- ANOVA的用途:a. 均数差别的显著性检验;b. 分离各有关因素并估计其对总变异的作用;c. 分析因素间的交互作用;d. 方差齐性检验。
- ANOVA根据自变量的个数(单因素,双因素,多因素)、协变量的个数及因变量的个数(一元和多元MANOVA)的不同可以分为很多种;此外,根据样本之间是否相互独立,还可以分为普通方差分析(between subject, ANOVA)、重复测量方差分析(within subjct, Repeated measures ANOVA)及Mixed-design ANOVA。对自己数据进行分析前,首先要明确自己的数据属于哪一种类型。 不同类型有不同的表达式。
可参考: https://www.cnblogs.com/gyjerry/p/6287811.html
https://www.jianshu.com/p/e6c7e9b28113- ANOVA的模式有:Fixed-effects models(固态效应模式)、Random-effects models (随机)和Mixed-effects models(混合)。要根据自己的实验目的确定响应的模式,与事后检验相关。
可参考: https://www.jianshu.com/p/5665b80a211e
ANOVA分析包括:
ANOVA评估的假设条件要求数据服从正态分布和各组方差相等的条件下,所以在进行ANOVA分析之前,首先要对数据进行正态性检验(如shapiro-Wilk)和方差齐性检验(如Bartlett检验);
进行ANOVA检验;
对数据进行多重比较(如TukeyHSD函数);
对多重比较的结果进行绘图展示 (如plot(TukeyHSD),multicomp包);
可参考http://blog.sciencenet.cn/blog-3406804-1190969.html残差分析检验回归模型的正确性;
Effect Size分析;
事后检验,多重比较还是正交性比较,p-value的校正;
R语言中,aov, anova, lm的比较