R语言之排序分析

示例数据
提取码:szjy

1. 数据准备

rm(list = ls()) #清空当前工作环境
library('vegan')
grp = read.table('grp.txt', row.names = 1, header = T, sep = '\t')
env = grp[,-c(1:2)]
otu=read.table("OTU.txt",header=T,row.names = 1, sep = '\t') #读取因变量矩阵

library('dplyr')
otu = otu[,rownames(grp)] %>% .[rowSums(.) !=0,] %>%  t() #去除均为0的行,对列排序,转置
otu.helli=decostand(otu,method = "hellinger") #标准化

2. 模型选择

decorana(otu.helli) #执行DCA去趋势分析

根据看分析结果中Axis Lengths的第一轴的大小

  • 如果大于4.0,就应选CCA(基于单峰模型,典范对应分析)
  • 如果在3.0-4.0之间,选RDA和CCA均可
  • 如果小于3.0, RDA的结果会更合理(基于线性模型,冗余分析)

3. 构建模型

fit.0 <- rda (otu.helli ~ 1, data = env) #因变量矩阵和指示变量逐个进行RDA分析
fit.all <- rda (otu.helli ~ ., data = env) #因变量矩阵与所有环境变量进行RDA分析
fit <- ordiR2step (fit.0, scope = formula (fit.all)) #执行前向选择 

若是cca(),则使用ordistep()

4. 模型检验

vif.cca(fit)  # 除去值大于10的环境因子,因其与其他变量存在高度线性相关
(total = summary(fit))  # 查看RDA分析结果
summary(eigenvals(fit))  # 查看每个排序轴的特征值和能够解释的变异

#查看模型统计特征
anova.cca(fit) # 查看RDA模型显著性
anova.cca(fit, by="term", parallel=2) # 查看解释变量的显著性
anova.cca(fit, by="axis") # 查看排序轴的显著性

5. 求各个环境因子对整体变异的解释率(贡献率)

基本模型是 rda(x,y,z)或者rda(x~y+condition(z))

  • x为响应矩阵,通常为群落矩阵,必须有
  • y为限制性矩阵,通常为环境变量的矩阵,可无,则rda(x)相当于prcomp(x)执行主成分分析
  • z为条件矩阵,通常也是环境变量,意味着排除(partialed out)该条件矩阵的影响,可无,则为常规rda()或者cca()分析
# 挑选出保留下来的环境因子
subenv = env[,c("AN", "AP", "TP", "AK", "TN")]
# 新建空矩阵,用来保存结果
res = matrix(0,nrow = 1, ncol = ncol(subenv)+4,
             dimnames = list(c('Inertia'),c('total','Unconstrained','constrained',names(subenv),'joint')))

res[,1] = total$tot.chi #总体方差
res[,2] = total$unconst.chi # 未解释方差
res[,3] = total$constr.chi # 当前变量所能解释的方差

for (f in names(subenv)){
  of = setdiff(names(subenv),f)
  temp <- rda(otu.helli, subenv[f], subenv[,of])
  temp$CCA$eig -> res[,f] #各个环境因子单独解释的方差
}

res[,ncol(res)] = total$constr.chi - sum(res[,-c(1:3)]) # 多个环境因子联合解释的方差
res = res/res[,1]

# 饼图展示效果
# jpeg('pie.jpg',width = 2000, height = 2000, res = 300)
pie(res[,-1],init.angle = 60,radius = 0.5,
    labels = paste(colnames(res)[-1]," ", round((as.numeric(res[,-1])),3)*100,'%'),
    main = "Variance explained by each factor",
    col=rainbow(8))
# dev.off()

严格来说,其中存在包含关系constrained = AN + AP + AK + TN + TP + Joint.
这里使用饼图只是为了方便展示

5. 基本绘图

plot(fit, type="n") #绘制RDA图
text(fit, dis="cn") #绘制RDA图
points(fit, pch=21, col="blue", bg="blue", cex=2) #绘制RDA图
text(fit, "sites", col='red', cex=0.5,  adj = 0.5, pos=2) #绘制RDA图

可以在图窗口点击export将图复制为meta file到Power Point或者Visio中修改

6. 使用ggplot2绘图

#获取样点坐标
sites = total$sites[,1:2] %>% data.frame() %>% merge(grp[,1:2],by = 'row.names') 

#获取指示变量坐标
biplot =total$biplot[,1:2] %>% data.frame()
biplot$env = rownames(biplot)

#定义样点组合在图例中的出场顺序
sites$treatment = factor(sites$treatment, levels = c('S','SH','H')) 
#重命名,须注意与上面的对应关系
levels(sites$treatment) = c('水田','水旱轮作','旱田') 

library('ggplot2')
library('ggrepel')

p <- ggplot(sites, aes(x = RDA1, y =RDA2, color = treatment)) +
  theme_bw() +  
  labs( x= "RDA1 (23.42%)", y = "RDA2 (11.84%)", color = '') + 
  guides(color = guide_legend(override.aes = list(size=5)))+ #增加图例中点的大小
  geom_hline(yintercept=0, linetype=2,color='grey') + #添加经过坐标原点的横线
  geom_vline(xintercept=0, linetype=2,color='grey') + #添加经过坐标原点的纵线
  geom_point(size = 3) +
  stat_ellipse(show.legend = F) + #添加置信区间
  geom_segment(data = biplot,
               aes(x = 0, y = 0, xend = RDA1, yend = RDA2), 
               arrow = arrow(length = unit(1/2, 'picas')), lwd = 1,
               colour = "blue") +  #添加箭头
  
  geom_text_repel(data = biplot, 
                  aes(x=RDA1,y=RDA2,label=env),
                  size= 5, fontface='bold',color='black')+ #添加指示变量文本
  
  theme(legend.position = c(0.9,0.2),
        legend.background = element_blank(),
        legend.text = element_text(face = 'bold',color='black',size=12),
        axis.title = element_text(face = 'bold',color='black',size=14),
        axis.text = element_text(face = 'bold',color='black',size=12),
        panel.grid = element_blank())
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,122评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,070评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,491评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,636评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,676评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,541评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,292评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,211评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,655评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,846评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,965评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,684评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,295评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,894评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,012评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,126评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,914评论 2 355