导读
PICRUSt (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States) 的原理基于已测细菌基因组的16S rRNA全长序列,推断它们的共同祖先的基因(同源基因)功能谱,对Greengenes数据库中其它未测物种的基因功能谱进行推断,构建古菌和细菌域全谱系的基因功能预测谱,最后,将测序得到的菌群组成“映射”到数据库中,对菌群代谢功能进行预测。
文献:
Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nature Biotechnology 2013
一、数据准备
1 QIIME2 DADA2分析的输出文件
1.1 rep-seqs.qza ## 代表性序列
1.2 table.qza ## 代表性序列丰度表,如下:
(导出qza文件的方法将在下面介绍)
2. Greengene细菌模板数据
下载地址:https://docs.qiime2.org/2019.1/data-resources/
下载得到gg_13_5_otus.tar.gz(最新版,大小为304M)后将其解压得到97_otus.fasta(最新版,大小约为139M),文件获取如下:
二、工作流程
1. 格式转换
将97_otus.fasta命名为gg_13_5_97_otus.fasta,并将其格式转化成QIIME2 qza格式
qiime tools import \
--type 'FeatureData[Sequence]' \
--input-path gg_13_5_97_otus.fasta \
--output-path gg_13_5_97_otus.qza
2. 聚类
参考QIIME2官方文档:https://docs.qiime2.org/2018.8/tutorials/otu-clustering/
qiime vsearch cluster-features-closed-reference \
--i-sequences rep-seqs.qza \
--i-table table.qza \
--i-reference-sequences gg_13_5_97_otus.qza \
--p-perc-identity 0.97 \
--p-threads 10 \
--output-dir picrust/closed_ref_97_otu
3. 将qza格式转换biom格式
qiime tools export --input-path closed_ref_*_otu/clustered_table.qza --output-path closed_ref_*_otu/
4. 将biom格式转成tsv格式
biom convert --to-tsv -i feature-table.biom -o feature-table.tsv
这样就得到了OTU丰度表feature-table.tsv。接下来用PICRUSt(网址:http://huttenhower.sph.harvard.edu/galaxy/)进行在线菌群代谢功能预测,步骤如下:
三、PICRUSt预测菌群KEGG通路
1 上传数据
1.1 点击上传控件
1.2 选择上传格式和需要上传的本地文件;点击Start开始上传;点击Close返回
2 数据标准化
按如下操作:
3 KEGG代谢通路预测
按如下要求操作:
4 功能分类
按如下要求操作:
5 下载预测结果
6 菌群KEGG预测结果
相关阅读:
16S测序分析(一)菌属丰度表获取
16S测序分析(二)菌群多样性分析
16S测序分析(三)用LEfSe寻找组间差异细菌
16S测序分析(四)用MaAsLin寻找组间差异细菌
16S测序分析(五)用RandomForest寻找关键细菌