微生物-环境因子

目录

  • VIF方差膨胀因子分析
  • RDA/CCA分析
  • db-RDA分析
  • Mantel Test分析
  • 相关性Heatmap图
  • 环境因子排序回归分析
  • VPA方差分解分析
  • MaAslin分析
  • Procrustes分析
VIF方差膨胀因子分析

影响样本菌群组成的环境/临床因子很多,但其中有很多环境/临床因子之间具有较强多重共线性(相关)关系,会影响后续的相关分析,所以在进行环境/临床因子关联分析前,可以对环境/临床因子进行筛选,保留多重共线性较小的环境/临床因子,进行后续研究。VIF(Variance Inflation Factor,方差膨胀因子)分析目前常用的环境/临床因子筛选方法。VIF表达式为:VIFi=1/(1-Ri2)。其中Ri2代表模型中与其它自变量相关的第i个自变量的方差比例,用于衡量第i个自变量与其它自变量间的共线性关系。VIF值越大,表明自变量间的多重共线性关系越严重。通常认为VIF值大于10的环境因子是无用的环境因子。过滤掉VIF大于10的环境因子,进行多次筛选,直到选出的环境因子对应的VIF值全部小于10为止。
VIF分析过程中,需要基于RDA/CCA进行相关性分析,RDA/CCA 模型选择原则同RDA/CCA分析。

RDA/CCA分析

RDA分析即冗余分析,是环境因子约束化的PCA分析,可以将样本和环境因子反映在同一个二维排序图上,从图中可以直观地看出样本分布和环境因子间的关系。CCA分析是基于对应分析发展而来的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。此分析主要用来反映菌群与环境因子之间关系。RDA是基于线性模型,CCA是基于单峰模型。分析可以检测环境因子、样本、菌群三者间的关系或者两两之间的关系。

  • 1)RDA或CCA模型的选择原则:先用species-sample数据(97%相似性的样本OTU表)做DCA分析,看分析结果中Lengths of gradient第一轴的大小,如果大于等于3.5,就CCA,如果小于3.5,RDA的结果要好于CCA。
  • 2)通过bioenv函数判断环境因子与样本群落分布差异的最大Pearson相关系数,通过最大相关系数得到环境因子子集。
  • 3)将样本物种分布表与环境因子或环境因子子集分别做CCA或者RDA分析。
  • 4)通过类似于ANOVA 的permutest分析来判断CCA或者RDA分析的显著性。
    软件:R语言vegan包中rda或者cca分析和作图。
db-RDA分析

RDA分析是一种约束性对应分析方法,常采用欧氏距离(Euclidean distances)进行分析。但是欧氏距离并不适用于一些数据类型,采用db-RDA分析可以解决数据类型的限制,并用于分析物种与环境因子之间的关系。
db-RDA(distance-based redundancy analysis)是一个五步分析过程:

  • 1)计算距离矩阵(非 UniFrac 距离,默认选择Bray-Curtis距离);
  • 2)PCoA分析;
  • 3)创建虚拟变量矩阵;
  • 4)利用RDA分析主坐标(物种数据)与虚拟变量(模型数据)之间的关系
  • 5)进行db-RDA分析。
    db-RDA分析,和PCoA分析类似,但是一种加入了环境因子约束性的分析。
Mantel Test分析

Mantel test是检验两个矩阵相关关系的非参数统计方法。Mantel test多用在生态学上检验群落距离矩阵(比如UniFrac distance matrix)和环境变量距离矩阵(比如pH,温度或者地理位置的差异矩阵)之间的相关性(Spearman 等级相关系数等)。Partial Mantel test在控制矩阵C的效应下,来检验A矩阵的残留变异是否和B矩阵相关。该分析输入两个数值型矩阵,第三个控制矩阵可通过选择因子来确定。
软件:Qiime

相关性Heatmap图

相关性 Heatmap分析通过计算环境因子与所选物种之间的相关性系数(Spearman等级相关系数、Pearson相关系数等),将获得的数值矩阵通过Heatmap图直观展示。通过颜色变化反映二维矩阵或表格中的数据信息,颜色深浅表示数据值的大小,它可以直观地将数据值的大小以定义的颜色深浅表示出来。
软件:R(pheatmap package)。

环境因子排序回归分析

线性回归(Linear Regression)是利用数理统计中回归分析,来确定一个或多个自变量和因变量之间关系的一种统计分析方法。环境因子排序回归分析,常根据Alpha多样性或Beta多样性分析结果,以各样本对应的Alpha多样性指数,或在Beta多样性分析结果PC1轴上的分值为y轴,以该样品对应的环境因子(如pH、温度等)为x轴做散点图,并进行线性回归(Linear Regression),标注R2,可用于评价二者间的关系。其中R2为决定系数,代表变异被回归直线解释的比例。

VPA方差分解分析

VPA(Variance partitioning analysis)方差分解分析,可用于定量评估两组或多组(2~4组)环境因子变量对响应变量(如微生物群落差异)的单独解释度和共同解释度,常配合RDA/CCA使用。
分析软件:R语言vegan包中vpa分析。

MaAslin分析

MaAslin(Multivariate Association with Linear Models)分析是一种通过线性模型挖掘环境因子(如临床数据标等)与微生物群落物种或功能相对丰度(data)间相关性的分析方法,结果为一个环境因子对应一个物种或功能相对丰度的线性关系,而与其他环境因子无关。环境因子可以是连续型数据(例如年龄和体重),布尔型数据(性别),或离散型/因子数据(队列分组和表型),data代表的物种相对丰度或功能相对丰度百分比,其分布一般不符合正态分布,因此在该分析过程中data要进行反正弦平方根标准化,而环境因子通过boosting算法得到潜在的与data有联系的环境因子,在构成多元线性模型之前,还需要对环境因子和data进行质检,剔除一些异常值,和一些低丰度或无差异的值。最后以环境因子为预测值,data为响应量构建多元线性模型,计算对应的相关系数,进行相关性显著检验。相关系数大于0时,表示正相关;小于0,表示负相关,当对应的显著性检验值p值和q值符合阈值时,非连续型数据绘制箱式图,连续型数据绘制其中线性拟合度最高的散点图。

Procrustes分析

Procrustes分析(Procrustes analysis)是一种用来分析形状分布的方法。数学上来讲,就是不断迭代,寻找标准形状(canonical shape),并利用最小二乘法寻找每个样本形状到这个标准形状的仿射变化方式。普氏分析可基于不同多元数据集的排序构型(≥2组),通过平移、旋转、缩放等转换方式,实现最大叠合(maximal superimposition),用于不同数据集的对比分析。排序方法可选择PCA、PCoA等。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容