本节就要进入更为关键的分析流程了——菌群组成的分析。进行16S测序的目的就是为了研究不同样本间的菌群组成差异,本节我们将讲解如何用qiime1绘制菌群丰度分布图、菌群差异分析以及绘制菌群丰度热图。
绘制菌群丰度分布图
菌群分类统计图能够展示每个组或者每个样本的菌群比例。在qiime1中用于生成该图像的命令是summarize_taxa_through_plots.py
,该命令具体包括3个指令:
collapse_samples.py and/or sort_otu_table.py
(http://qiime.org/scripts/collapse_samples.html/ http://qiime.org/scripts/sort_otu_table.py)summarize_taxa.py
(http://qiime.org/scripts/summarize_taxa.html)plot_taxa_summary.py.py
(http://biocore.github.io/emperor/build/html/scripts/plot_taxa_summary.py.html)
其中第一步collapse_samples.py and/or sort_otu_table.py
是一个非必需步骤,主要取决于你是否需要对样本进行选择性的展示,如果你只想展示某一部分样本,或者想要合并某一组的样本可以使用该命令。
# Plot group average 绘制每组平均值
summarize_taxa_through_plots.py \
-i otu_table.biom \
-o taxa_summary_plots \
-m mapping_file.txt \
-c SampleType
# Plot each sample 绘制每个样本
summarize_taxa_through_plots.py \
-i otu_table.biom \
-o taxa_summary_plots \
-m mapping_file.txt
最后会产生一个文件夹。其中有一个网页.html会展示所有的图片结果,你也可以在文件夹中找到原始的图片。
丰度差异的检验
通过绘制菌群丰度分布图后,你大致了解了样本中丰度较高的菌群主要有哪些。那么接下来,你肯定会好奇在你的实验组和对照组中究竟有哪些OTU存在显著差异。Qiime1提供了检测差异的命令,当然你也可以使用其他非常流行的方法比如LEfSe。之后我们会对如何使用LEfSe进行讲解,本节我们先讲解如何使用Qiime1自带的命令进行检验比较。
Qiime推荐了两种方法,第一种是geroup_significance.py
group_significance.py \
-i otu_table.biom \
-o kruskal_wallis_test.txt \
-m mapping_file.txt \
-c SampleType \
-s kruskal_wallis
其中-s方法可以选择下述检验方法:nonparametric_t_test, bootstrap_mann_whitney_u, ANOVA, kruskal_wallis, g_test, parametric_t_test, mann_whitney_u
另外一种是利用DESeq2进行更加深入的差异检验(做过RNA-seq分析的人一定对这个名字DESeq2不陌生)。具体如下:
differential_abundance.py
-i otu_table.biom
-o diff_otus.txt
-m mapping_file.txt
-a metagenomeSeq_fitZIG
-c Treatment
-x Control
-y Fast
其中-c是告诉程序需要比较哪一项,比如在此处我们想要比较不同Treatment的差异,其中Treatment有两组Control和Fast,所以告诉程序-x是Control组,-y是Fast组。
想要知道这两个命令更为详细的信息可以查看:
group_significance.py:
http://qiime.org/scripts/group_significance.html
differential_abundance.py:
http://qiime.org/scripts/differential_abundance.html
样本丰度归一化
除了使用相对丰度对样本进行归一化,Qiime1还提供了DESeq2和CSS这些归一化方法。经过归一化的样本更加适合进行fitZIG和DESeq2的差异检验。
normalize_table.py \
-i otu_table.biom \
-o otu_table_deseq2_normalized.biom \
-a DESeq2
绘制丰度热图
热图是一种直观的展示各个样本不同菌群丰度的形式。Qiime1也可以直接制作热图。
make_otu_heatmap.py \
-i otu_table.biom \
-o heatmap_sorted.pdf \
-m mapping_file.txt \
-t rep_set.tre