宏基因组学研究—纵向微生物组数据分析

1. 宏基因组纵向数据的意义

1.1 纵向数据提供了更多的信息

纵向数据从根本上比单点(End-point)数据提供了更多的信息,因为时间系列有两个特殊特征:

(a)时间对样本施加了固有的、不可逆的排序;

(b)样本具有时间函数的统计相关性。  

时间系列数据的特征使得人们能够发现关于研究系统的丰富信息,包括短期和长期趋势,甚至系统变量之间的因果关系。  

然而,时间系列数据的这些特征也使分析复杂化,需要使用适当的计算分析技术。

2.纵向微生物组数据分析解决的关键科学问题

2.1 幼儿微生物群落的发育

子宫基本上是没有微生物的,从婴儿出生便开始建立个体的微生物群落。婴儿经历了一些列的发展变化,随着时间的推移,这些变化改变了他们的生理结构、生理变化、免疫反应。此外,孩童出生的头几年,饮食和暴露的环境的变化将影响微生物群落的变化,进而影响宿主的代谢和生理。由动物模型的研究表明,在早期生命的某些“窗口期”内,微生物群的组成可以极大地影响免疫系统的发育。

2.2 健康成人微生物群落随时间的变化

微生物群落在儿童期后不会一层不变。健康成年人通过会做出改变微生物群落的行为,包括每天吃不同的食物,通过旅行接触新的微生物群落。  

女性和男性生理学上的变化也会影响微生物群落的变化。  

随着时间的推移,健康成人的微生物变化的表征可以提供对时间驱动的微生物群落变化因素的观测,同时也为鉴别正常时间驱动的微生物群落变化与其他因素导致微生物群落失调提供了基础。

2.3 微生物群落对扰动的响应

感染、疾病或有意干预,如抗生素治疗、膳食调整,能显著改善微生物菌群。关键问题是,微生物菌群在扰动后是恢复到原来的状态还是最终进入一个新的状态,以及到达平衡状态的速度如何。了解这种扰动对微生物菌群的影响,有助于了解健康状态或益生菌对环境相互作用和医学干预对菌群影响的稳定性,并最终向我们提供如何重塑微生物菌群以造福宿主。

3.微生物菌群按时间序列数据分析的计算方法

3.1 基于回归的计算方法

随着时间或趋势的长期变化,可以通过对一系列时间观测值进行回归建模。即,我们可以将一系列观察结果(因变量)作为时间和其他协变量(自变量)的函数来建模。  

一系列观测值Y随时间的回归可用以下一般方程表示:

                               ​𝑌_𝑡=𝑓(𝑡;𝜃)+𝜀_𝑡

 𝑌_𝑡表示因变量在时间点的值𝑡𝑓(𝑡;𝜃)是具有参数向量u的时间函数,𝜀_𝑡是随机误差项。  

通过为𝑓(𝑡;𝜃)指定不同的函数形式,通用模型可以捕获时间系列数据中的多种趋势。实际上,这种回归模型的输入是一列观测值(例如,OTU丰度)和一列观测值的时间。然后可以使用统计软件包,如R或Matlab来拟合模型。

另一种回归模型称为自回归(autoregressive,AR)模型,它不像前面所列方程,直接回归时间点上的观测值,而是基于之间的观测值回归现有的观测值。从概念上讲,AR模型允许对未来进行预测,并捕捉到对未来事件越来越不确定的现象;相反,直接按时间点回归的模型,则假设在任何时间点预测变量的能力相等。 

AR模型的一般公式为:

                                        𝑌_𝑡=\sum_{i=1}^P 𝜃_𝑖 𝑌_{(t-i)} +𝜀_𝑡

此方程指定了一个p阶的自回归模型,表示为AR(p),这意味着t时刻的数据依赖于p个先验数据点。如前述方程所示,Yt表示在时间点t处感兴趣的变量的值,例如,特定OTU的相对丰度。然而,本方程的右侧与前述方程的右侧不同,因为此方程中,时间没有被明确表示出来。相反,时间是由感兴趣的前序变量的值捕获的。

自相关(Autocorrelation)分析,涉及计算时间系列(例如,OTU的相对丰度序列)和不同状态下的自身情况之间的相关性,它提供了探索AR模型阶次的一种快速方法,该方法需要捕获时间系列中存在的依赖项。统计软件包,如R和Matlab,提供了各种各样的函数,可以方便地拟合AR模型,进行自相关分析和可视化图表绘制。

3.2 状态空间模型(State-SpaceModels)

概率性的状态空间模型:假设一个系统的输出或测量依赖于它的状态,它可以随时间而改变。在某些情况下,系统的状态可能直接对应于可观测的量(如温度)。然而,在许多情况下,系统的状态不能直接观察,必须从其输出中推断出来。状态空间模型对于检测系统何时发生实质性变化特别有用。另外,这些模型在分析多个变量时非常有用,因为系统的底层状态可以同时驱动多个变量的行为。  

一种广泛使用的一般化状态空间模型是隐马尔可夫模型(HMM),它假设系统在任何给定时间处于离散状态,并且系统在每个离散时间步长内可能会发生状态变化。状态是“隐藏”的,因为它们不是直接观察到的,而是可以使用有效的算法从数据中推断出来的。  

HMM的p阶表示当前状态所依赖的过去状态的数目。  

标准HMM模型的状态数必须预先指定,尽管非参数贝叶斯HMM已经开发出来,可以从数据中推断出状态数。

3.3 时间模式聚类

在复杂的宿主-微生物生态系统中,微生物物种群体的相对丰度随着时间的推移呈现出相似的变化模式。这些群体或簇可由具有相似代谢或其他功能能力的物种组成,或在宿主体内的微环境中物理位置相对接近的生物种组成。 

在不同个体或同一个体内微生物群落,受到不同干预的微生物群体的数量可以告诉我们微生物群体内的相应情况。 

这种分类数据的计算方法通常要求用户预先指定分类的数量,然而,在许多情况下,包括在大多数微生物应用中,数据中存在的簇的数量是先验未知的。因此,自动化的和统计原理的聚类方法尤为重要。

微生物计数轨迹无限混合模型引擎(MC-TIMME),是一种专为分析微生物数据而定制的时间序列聚类算法,可以自动从数据中推断出时间模式的数量。  

MC-TIMME使用了一种非参数贝叶斯技术,即DirichletProgress,它假设数据来自连续时间模式的无限混合。使用近似推理方法,完全贝叶斯MC-TIME算法估计模型变量上的分布,包括非空混合分量的数目。因此,MC-TIMME提供了所有变量的“误差线”(不确定性度量),包括群体/时间模式的数量和每个时间模式的状态。此外,MC-TIMME通过聚类显示相似模式的多个时间系列的信息,提供了对单个时间模式的更精确的估计。

3.4 实验设计

有原则的实验设计对于纵向研究尤其重要。纵向研究中的采样欠缺,一方面会使系统中的重要变化无法检测。另一方面,过度采样可能非常昂贵,或者在逻辑上不实用,特别是当涉及到人类受试者时。通常,随着时间的推移,复杂的宿主-微生物生态系统可能发生变化的频率是未知的。在这些情况下,需要进行经常抽样的预实验,以收集初步数据,作为研究更大队列的实验设计的基础。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342

推荐阅读更多精彩内容