1)生态实验设计
本章节中, 我们回顾下实验设计的基本类型,具体解释不再赘述,可自行百度或找相关书目
-
完全随机设计
Completely randomised design -
随机区组设计
Randomised complete blocks -
拉丁方设计
Latin square design
2)假重复(Pseudoreplicates)
假重复是生态学研究中最常见的统计错误之一。通过这种实验设计搜集到的数据评价的是样地之间的均值,而不是实验处理之间的差异。
假重复的本质在于样地的相似性随着其空间距离的增加而降低,随着空间距离的缩减而增加(即distance-decay), 这种样地的相似性涵盖了和
。
因此,对于生态学实验来讲,合理的重复数是必须要考虑的事情。但是,由于研究资源的限制,我们常常面对着一个困境,即是否需要牺牲一定的空间和时间尺度来满足正确的统计设计。这产生了巨大的争论,而实验生态学家由此也被划分成两派:一派坚持重复和对照,拒绝牺牲时、空尺度;一派坚持合适的时、空尺度对重复的优先级。更多时候,我们需要对二者进行权衡。相比之下,兼顾尺度和合理重复数的研究结果比假重复的研究结果更易为大家接受。
Refs:
整理译自 Multivariate Analysis of Ecological Data using Canoco 5(Second Edition)
Petr Smilauer, University of South Bohemia
Jan Leps, University of South Bohemia
3)时间序列数据——“多年均值”
今天处理数据,需要用到丰富度的多年均值,然后做方差分析。但是,结果却不显著。与实验室同学讨论之后,发现重点在于对“多年均值”的理解。
- choice 1:针对每个处理,先求每个年份组内均值,后求多年均值, 再比较组间差异
- choice 2:针对每个重复,先求多年均值,再比较组间差异
数据如下:
# P代表不同样方编号,W是处理水平,Y表示年份
> head(plantR, 20)
Y W C P Richness
1 2015 C 0 5 22
2 2015 C 0 9 19
3 2015 C 0 17 18
4 2015 C 0 23 19
5 2015 C 0 27 11
6 2015 W1.5 0 4 20
7 2015 W1.5 0 11 16
8 2015 W1.5 0 14 17
9 2015 W1.5 0 21 20
10 2015 W1.5 0 29 17
11 2015 W2.5 0 1 18
12 2015 W2.5 0 8 21
13 2015 W2.5 0 16 20
14 2015 W2.5 0 20 15
15 2015 W2.5 0 26 17
31 2016 C 0 5 22
32 2016 C 0 9 18
33 2016 C 0 17 18
34 2016 C 0 23 22
35 2016 C 0 27 22
单因素/双因素方差结果
先正常计算Y,W对丰富度的影响,不管单因素还是双因素均有显著影响
> summary(aov(Richness~ W +Y, plantR))
Df Sum Sq Mean Sq F value Pr(>F)
W 2 94.1 47.06 4.708 0.0111 *
Y 1 310.3 310.29 31.041 2.1e-07 ***
Residuals 101 1009.6 10.00
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> summary(aov(Richness~ W, plantR))
Df Sum Sq Mean Sq F value Pr(>F)
W 2 94.1 47.06 3.637 0.0298 *
Residuals 102 1319.9 12.94
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Choice 2 方差结果
注意,此时W的单因素效应显著,P值为0.0298
> avePR1 = aggregate(Richness ~ Y + P, data = plantR, mean)
> avePR2 = avePR1 %>% right_join(plantR)
Joining, by = c("Y", "P", "Richness")
> summary(aov(Richness~ W +Y, avePR2))
Df Sum Sq Mean Sq F value Pr(>F)
W 2 94.1 47.06 4.708 0.0111 *
Y 1 310.3 310.29 31.041 2.1e-07 ***
Residuals 101 1009.6 10.00
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> summary(aov(Richness~ W, avePR2))
Df Sum Sq Mean Sq F value Pr(>F)
W 2 94.1 47.06 3.637 0.0298 *
Residuals 102 1319.9 12.94
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Choice 1 方差结果
注意,此时W的效应均变得不显著,而Y的效应显著
# 方差分析结果
> avePR = aggregate(Richness ~ Y + W, data = plantR, mean)
> summary(aov(Richness~ W + Y, avePR))
Df Sum Sq Mean Sq F value Pr(>F)
W 2 18.82 9.41 1.714 0.2099
Y 1 62.06 62.06 11.300 0.0037 **
Residuals 17 93.36 5.49
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> summary(aov(Richness~ W, avePR))
Df Sum Sq Mean Sq F value Pr(>F)
W 2 18.82 9.411 1.09 0.357
Residuals 18 155.42 8.634
# 多重比较结果
> library(agricolae)
> df<-df.residual(aov(Richness~W, avePR))
> MSerror<-deviance(aov(Richness~W, avePR))/df
> multi<-with(avePR, LSD.test(Richness, W, df, MSerror)); multi
...
$groups
Richness groups
C 17.20000 a
W1.5 15.91429 a
W2.5 14.88571 a
...
为什么出现上述W不同效应的结果。 个人认为,Choice 2针对样方求多年均值,抹平了样方的年际差异,进而计算的组间效应差异实际上包含了年际Y的效应,或许应该将这种“多年平均”称为“包含年际效应的组间差异”。而Choice 1更关注每年内的组间差异,或许可以称之为“组间差异的多年变异”。因此,对于Choice 1, 当我们将Y效应作为随机变量后,那么W效应是否还存在??结果显示,W对Richness的组间差异的效应极为显著。个人认为,二者的区别在于对年际效应的处理方式不同,你觉得哪种正确呢?欢迎一起讨论啊
> mod = lmer(Richness ~ W+(1|Y), data = avePR)
> car::Anova(mod,type=2)
Analysis of Deviance Table (Type II Wald chisquare tests)
Response: Richness
Chisq Df Pr(>Chisq)
W 15.258 2 0.0004862 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(更新:2022.12.11)
(未完待续)
4)多变量分析总论
群落生态学探讨生物群落与环境因子之间的关系,而群落数据包含了群落组成数据(Y)和环境因子数据(E)。从方法论的角度,传统的群落-环境模型(community-environment modelling)包含两步骤:
- 通过简单的多样性指数或更丰富的多变量分析,揭示物种分布和群落结构
- 使之与环境变异关联
生态学家首先采用间接梯度分析(indirect gradient analysis)来解释群落结构与环境关系,提取响应变量矩阵Y的site score,得到物种丰度信息的综合指数(composite indices),直接与环境因子的后验(a posteriori)进行比较分析。
随后,直接梯度分析(direct gradient analysis)发展起来,直接采用环境变量矩阵E来对排序进行先行约束。因此,直接排序被认为是多元回归的拓展。如此,Y的组成变异(特征值)被分解为两部分:环境因子拟合F和残差R。这即是典范分析。而偏典范分析(partial canonical analysis)考虑到了环境变量之间的协变化。
群落生态,尤其是微生物群落生态,环境变量能够解释的群落结构变异比例通常较小。因此,如何揭示这些无法测定的环境因子(unmeasurable)所解释的,或者,未测定的环境因子(unmeasured)所解释的生物群落结构变异一直是群落生态学中的一个难点。而空间显式模型(spatial explicit model)提供了一个可能性的思路。
(更新2023.03.30)
(未完待续)