HUMAnN2是由Huttenhower组发布的,基于全基因组测序数据用于计算基因丰度的软件。本节我们要用其对PICRUSt产生KEGG gene数据进行KEGG通路的分析。
HUMAnN2是由Huttenhower组发布的,基于全基因组测序数据用于计算基因丰度的软件。
该工具也可以用于PICRUSt数据将KEGG genes重建为KEGG pathways。在我们处理我们的16S数据之前,我们首先需要安装HUMAnN2和HUMAnN(之前的版本)。
Step1:通过pip安装HUMAnN2
pip install humann2
Step2:下载HUMAnA的安装包并解压。你只需要从文件中获取一个文件:humann-0.99/data/keggc
。运行下列代码或者手动下载包并解压:https://bitbucket.org/biobakery/humann/downloads/humann-v0.99.tar.gz
#下载至本地
wget ~/ https://bitbucket.org/biobakery/humann/downloads/humann-v0.99.tar.gz
#解压该压缩包
tar -zxvf ~/humann-v0.99.tar.gz
Step3:a.建立新的文件存储临时文件
mkdir split_files #存储临时文件
mkdir humann2_out # 存储由HuMAnN2产生的文件
mkdir humann2_tables # 存储最终的表格
Step3:b.将PICRUSt的宏基因组预测表格(.biom)拆分成单个的biom文件
humann2_split_table \
-i metagenomic_predictions.biom \
-o split_files
Step4:运行HUMAnN2循环遍历每个文件,生成通路丰度文件
for biom in split_files/*.biom
do
humann2 \
--input $biom \
--output picrust/humann2_out \
--pathways-database ~/humann-0.99/data/keggc
done
Step5:将所有HUMAnN2产生的相同类别的表格合并成为一张表格。最终生成两个文件:通路丰度和通路覆盖度表格。后续的分析,只会用到通路的丰度文件。
#合并所有的通路丰度文件
humann2_join_tables \
--input humann2_out/ \
--output humann2_tables/humann2_pathabundance.txt \
--file_name pathabundance
# 合并所有的通路覆盖度文件
humann2_join_tables \
--input humann2_out/ \
--output humann2_tables/humann2_pathcoverage.txt \
--file_name pathcoverage
Step6:默认情况下,HUMAnN2将"_Abundance"添加到结果表的每个样本名称中。这些名称可以影响丰度表和映射文件元数据样本ID之间的交互匹配。我们可以手动编辑该文件,或运行下面的命令,使用终端删除它。
sed 's/_Abundance//g' humann2_tables/humann2_pathabundance.txt > humann2_tables/humann2_pathabundance_fixed.txt
Step 7:为KEGG通路添加完整名称
humann2_rename_table \
-i humann2_tables/humann2_pathabundance_fixed.txt \
-o humann2_tables/humann2_pathabundance_named.txt \
-n kegg-pathway \
--simplify
Step8:对表格归一化转为相对丰度
humann2_renorm_table \
-i humann2_tables/humann2_pathabundance_named.txt \
-o humann2_tables/humann2_pathabundance_named_relab.txt \
--units relab
Step 9:通过其他软件进行分析
STAMP:可以参考STAMP:扩增子、宏基因组统计分析神器(中文帮助文档)
PRISM
LEfSe
当然还可以选择功能强大的R。
至此,Qiime1的分析基本流程就结束啦。希望这一系列的文章能够帮助你分析你的16S数据。
最近Qiime2终于在PeerJ上发布了文章,也看到了不少公众号再次重新介绍了Qiime2的分析流程。之后有机会的话也会再介绍一下Qiime2的分析流程。
另外,有时间的话,我也会发一些关于如何用R来绘制更加好看的PCA、PCoA等图的文章,当然其实简书以及其他平台上已经有很多这样的文章了。
接下来我要继续回去更新完成我的Biostat专辑啦。
祝大家科研顺利~
Happy New Year