---待更新---
- 微生物群体的鉴定,常通过对16S rRNA基因(细菌或古细菌)、ITS(内转录间隔区)基因(真菌)、18S rRNA基因(真菌)或者其他标记基因进行扩增测序来实现的。
基本概念
1. 微生物组(Microbiome)
- 微生物组是包括微生物(细菌、古菌、低等或高等的真核生物和病毒)、它们的基因组,以及微生物和宿主环境的产物。
2. 宏基因组(Metagenome)
- 宏基因组指的是微生物群成员的基因组和基因。通过宏基因组测序可以获得微生物群成员的基因集,因而可以分析微生物生物群的功能和通路。不仅如此,通过宏基因组测序数据分析还可能得到 难以分离培养的高丰度菌的基因组草图。
3. 16S rRNA基因
- 指的是原核生物基因组中编码核糖体16S rRNA基因对应的DNA序列
- 所有原核生物包括细菌都有16S基因,因其高度的多样性,通过16S测序可以高效的鉴定样本中的细菌群的组成。
- 原核生物编码核糖体30S小亚基组分(16S rRNA)的基因,全场为1500bp左右,包括了9个可变区域(V1~V9)和10个保守区。
- 保守区域反应了物种间的亲缘关系。
- 可变区则可提现物种间的差异,其变异程度与细菌的系统发育密切相关,被认为是目前最适合用来群分细菌群体组成的方法。
4. ITS(内转录间隔区)基因
- 位于真核生物包括真菌的rRNA编码基因 18S(SSU) ,5.85S和28S(LSU)之间的小基因片段,包括ITS1和ITS2。由于ITS区不加入成熟核糖体,所以ITS片段在进化过程中承受的自然选择压力非常小,在绝大多数的真核生物中表现极为广泛的序列多态性。ITS片段的进化速率是18S rDNA的10倍。这是ITS序列在真菌种类鉴定和群落分析的理论基础。
ITS.jpg
5. 扩增子测序/宏分类组
-
原理:扩增子测序是对特定的DNA片段进行扩增测序。例如细菌的16S基因、真核的ITS/18S rRNA基因和其他的功能基因,然后进行微生物群落组成的鉴定。
扩增子流程.jpg
6. 宏基因组测序
- 宏基因组测序的原理是对样本所有的DNA进行测序,通过段序列组装或直接比对数据库,识别微生物群落的组成(包括细菌、古菌、真菌、病毒等类群),通过基因预测获取可能行驶的功能。
- 得到cleandata后下游分析分为两大类:
- 一个是是使用MEGAHIT等方法进行contigs拼接,再使用MetaGeneMark等方法进行gene预测,获取Unigene后通过比对NR,GO,KEGG等数据库进行物种和功能的注释。
- 另一类使用Kraken2和HUMAnN2等方法通过直接比对进行物种和功能分析。
-
如果测序深度足够还可以基于宏基因组数据进行binning获取高丰度物种的基因组草图。
宏基因组流程.jpg
微生物组学常见结果解析
1. 扩增子数据结果解读
-
做扩增子测序有什么意义?
(1)了解在不同组的样本中菌群的丰富度以及有哪些细菌或真菌的存在(对于α多样性分析以及菌群分类学鉴定结果)
(2)看不同组样本间微生物群组成是否存在差异(对于β多样性分析结果,从全局角度告诉我们不同样本间的菌群构成差异)。通常不同组的样本间都会存在或大或小的差异,这表明菌群构成的变化与疾病或表型存在的联系。
(3)再接着有必要找出引起不同组样本微生物群差异的关键菌(对于菌群的差异结果)
(4)找到关键菌,在临床上,关键菌是否可以作为Biomarker(对应于疾病诊断模型构建结果),比如用于区分糖尿病前期患者与健康组的标记物。
(5)并讨论这些菌是否与生理生化或临床指标具有相关性(对应于菌群与环境指标的相关性分析)
(6)既然不同组的微生物群存在差异,又与疾病或表型具有相关性,那么就可以研究这些菌群是如何影响宿主的,可能参与哪些代谢途径(对应于菌群功能预测结果)。要获取菌群携带的基因信息,则需要进一步进行宏基因组测序。此外,菌群数据与宏代谢组和/或宿主代谢组数据结合,是目前最主流的研究菌群与宿主互作的方式。
扩增子研究思路.jpg -
菌群的α多样性
- α多样性是度量单个样本内有多少种微生物物种,以及每个物种所占比例的指标。一般采用6种常见的指标度量:
- Observed species和Chao1反映样本中的物种丰富度,但不考虑每个物种的占比情况(均匀度)。
- Shannon和Simpson反映物种的丰富度和均匀度
- Good’s Coverage反映样本的测序深度
- Pielou_e是衡量物种均匀度的指标
- α多样性是度量单个样本内有多少种微生物物种,以及每个物种所占比例的指标。一般采用6种常见的指标度量:
-
菌群的β多样性
- β多样性是度量不同组样本间菌群组成的相似度大小的指标,即关注各样本间的菌群组成差异。可以采用PCA、PCoA、NMDS、ANOSIM、Adonis、UPGMA等多种分析方法来考察和区分样本间的菌群组成差异。
2. 宏基因组数据结果解读
- 这里表述一下宏基因组不同于扩增子的数据结果以及含义
- 可以同时对细菌、古菌、和病毒进行物种注释和基因预测。但是注意宏基因组测序实验中没有对低丰度微生物进行专门的富集,所以宏基因组数据主要来源于高丰度的微生物如细菌。
- 在物种分类学鉴定上,宏基因组测序比扩增子测序鉴定更精细。宏基因组测序可以将微生物鉴定到种水平。甚至到株的水平,而后者通常鉴定到属。这是由于宏基因组测序得到的序列信息更丰富,可以根据特定微生物物种所独有的标记基因,进行“高分辨率”的菌群组成鉴定。
- 宏基因组测序可以鉴定菌群携带的基因信息,并通过多种数据库等对基因功能进行多维度的注释。
- 宏基因组测序可以进行菌群基因的相对丰度分析,差异基因分析,以及差异基因的功能富集分析。
- 采用binning算法,使用宏基因组数据可能获取无法培养的高丰度菌的基因组草图,进而在单菌组装的结果的基础上进行菌株水平的基因注释和功能注释、比较基因组分析、进化分析等。