1.PICRUSt简介
PICRUSt全称为Phylogenetic Investigationof Communities by Reconstruction of Unobserved States,由Langille等人于2013年开发,文章发表在Nature Biotechnology上(Langille et al. 2013)。它是最早被开发的基于16S rRNA基因序列预测微生物群落功能的工具,包括在线版(http://huttenhower.sph.harvard.edu/galaxy/root?tool_id=PICRUSt_normalize)和基于MacOS X或Linux系统的下载安装版(http://picrust.github.io/picrust/install.html#install)。
原理
如图1所示,其预测过程分两步:
(1)基因内容预测(gene content inference)。该步先对Greengenes数据库的“closed reference”序列划分OTU后构建进化树,通过祖先状态重构(Ancestralstate reconstruction)算法并结合IMG/M数据库,预测出树中未进行全基因组测序OTU的基因组信息。
(2)宏基因组预测(metagenome inference)。将16SrDNA测序结果与Greengenes数据库进行比对,挑选出与“closed reference”数据库相似性高的(默认为≥97%)OTU;根据OTU对应基因组中16SrDNA的拷贝数信息,将每个OTU对应序列数除以其16S拷贝数来进行标准化;最后,将标准化的数据乘以其对应的基因组中基因含量从而实现宏基因组预测的目的。获得的预测结果可以通过KEGG Orthology、COGs或Pfams等对基因家族进行分类。
2.在conda下picrust2的安装
source activate qiime2-2018.8 #激活环境
conda install -c anaconda -c defaults-chttps://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda -c https://conda.anaconda.org/biocore q2-fragment-insertion #安装fragment-insertion插件
conda install -c conda-forge -c bioconda -c gavinmdouglas q2-picrust2 #一步安装
3.picrust2的使用
先进行Vsearch,需要 table.qza,rep-seqs.qza,99-otu.qza文件,得到 table-cr-99.qza, rep-seqs-cr-99.qza,unmatched-cr-99.qza文件
qiime vsearch cluster-features-closed-reference \
--i-table table.qza \
--i-sequences rep-seqs.qza \
--i-reference-sequences 99_otus.qza \
--p-perc-identity 0.99 \
--o-clustered-table table-cr-99.qza \
--o-clustered-sequences rep-seqs-cr-99.qza \
--o-unmatched-sequences unmatched-cr-99.qza
# preparative file: table-cr-99.qza,rep-seqs-cr-99.qza,reference.fna.qza,reference.tre.qza
qiime fragment-insertion sepp \
--i-representative-sequences rep-seqs-cr-99.qza \
--p-threads 1 \
--i-reference-alignment reference.fna.qza \
--i-reference-phylogeny reference.tre.qza \
--output-dir tutorial_placed_out
qiime picrust2 custom-tree-pipeline \
--i-table table-cr-99.qza \
--i-tree tutorial_placed_out/tree.qza \
--output-dir q2-picrust2_output \
--p-threads 1 --p-hsp-method pic \
--p-max-nsti 2
qiime feature-table summarize \
--i-table q2-picrust2_output/pathway_abundance.qza \
--o-visualization q2-picrust2_output/pathway_abundance.qzv
qiime diversity core-metrics \
--i-table q2-picrust2_output/pathway_abundance.qza \
--p-sampling-depth 3192 \ #根据最小样本深度,在 table-cr-99.qza文件中找
--m-metadata-file sample-metadata.tsv \
--output-dir pathabun_core_metrics_out \
--p-n-jobs 1