ANOVA分析

关于ANOVA(方差分析)的定义:
不同处理组的均数间的差别基本来源有两个:实验条件和随机误差。

  1. 实验条件所带来的误差,成为组间差异(between),用变量在各组的均值与 总均值之偏差平方和总和(SSb)表示,自由度为dfb;
  2. 随机误差,称为组内误差(within),用变量在各组的均值与该组内变量值之偏差平方和(SSw)表示,自由度为dfw(即:n-m)。
  3. n为样本总数,m为组数,SSw/(n-m)=MSw(均方),SSb/(m-1)=MSb,若处理没有作用,则MSb约等于MSw; 若处理有作用,则MSb远远大于MSw, MSb/MSw比值构成F分布,若F值接近于1,则各组均值间的差异没有统计学意义,若远远>1,则有。
  4. ANOVA的用途:a. 均数差别的显著性检验;b. 分离各有关因素并估计其对总变异的作用;c. 分析因素间的交互作用;d. 方差齐性检验。
  5. ANOVA根据自变量的个数(单因素,双因素,多因素)、协变量的个数及因变量的个数(一元和多元MANOVA)的不同可以分为很多种;此外,根据样本之间是否相互独立,还可以分为普通方差分析(between subject, ANOVA)、重复测量方差分析(within subjct, Repeated measures ANOVA)及Mixed-design ANOVA。对自己数据进行分析前,首先要明确自己的数据属于哪一种类型。 不同类型有不同的表达式。
    可参考: https://www.cnblogs.com/gyjerry/p/6287811.html
    https://www.jianshu.com/p/e6c7e9b28113
  6. ANOVA的模式有:Fixed-effects models(固态效应模式)、Random-effects models (随机)和Mixed-effects models(混合)。要根据自己的实验目的确定响应的模式,与事后检验相关。
    可参考: https://www.jianshu.com/p/5665b80a211e
自变量与协变量的关系

Repeated measures design

表达式

ANOVA分析包括:

  • ANOVA评估的假设条件要求数据服从正态分布和各组方差相等的条件下,所以在进行ANOVA分析之前,首先要对数据进行正态性检验(如shapiro-Wilk)和方差齐性检验(如Bartlett检验);

  • 进行ANOVA检验;

  • 对数据进行多重比较(如TukeyHSD函数);

  • 对多重比较的结果进行绘图展示 (如plot(TukeyHSD),multicomp包);
    可参考http://blog.sciencenet.cn/blog-3406804-1190969.html

  • 残差分析检验回归模型的正确性;

  • Effect Size分析;

  • 事后检验,多重比较还是正交性比较,p-value的校正;

R语言中,aov, anova, lm的比较


R语言

contrasts函数可查看因子型变量在lm中的替代结果
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容