qiime2自建数据库进行物种注释

SynCom接种植物体系之后,为了研究它们的动态变化,扩增子是简单可行的方法,这也在science : Coordination between microbiota and root endodermis supports plant mineral nutrient homeostasisnatureA single bacterial genus maintains root growth in a complex microbiome中都有采用。但是作者只是一两句话带过分析的流程,摸索了一下,挺简单的,主线就是:前期数据拆分、质控、去噪 >> 得到代表性序列 >> 比对到自己构建的含有序列信息和物种注释信息的数据库 >> 可视化
记下来详细步骤:

  1. 准备文件: 自己测的16S全长序列,保存为fasta格式,如下:
    seq.fa

    序列的注释信息
    ref-taxonomy.txt
  2. 导入数据
qiime tools import \
  --type 'FeatureData[Sequence]' \
  --input-path ref-seqs.fa \
  --output-path ref-seqs.qza

qiime tools import \
  --type 'FeatureData[Taxonomy]' \
  --input-format HeaderlessTSVTaxonomyFormat \
  --input-path ref-taxonomy.txt \
  --output-path ref-taxonomy.qza
  1. 提取序列:根据你测的SynCom区选择需要提取的序列,用于后续分类器的训练,我这里是V3-V4 区 (338F (5’-ACTCCTACGGGAGGCAGCA-3’) / 806R (5’-GGACTACHVGGGTWTCTAAT-3’)) 参数就是字面意思,不解释了
qiime feature-classifier extract-reads \
  --i-sequences ref-seqs.qza \
  --p-f-primer ACTCCTACGGGAGGCAGCA \
  --p-r-primer GGACTACHVGGGTWTCTAAT \
  --p-trunc-len 460 \ 
  --p-min-length 400 \
  --p-max-length 480 \
  --o-reads ref-seqs_v34.qza

虽然--p-trunc-len我们指定的是460,但是它会智能的根据引物来截取,最终得到的序列是430bp左右

image.png

  1. 训练分类器
qiime feature-classifier fit-classifier-naive-bayes \
  --i-reference-reads ref-seqs_v34.qza \
  --i-reference-taxonomy ref-taxonomy.qza \
  --o-classifier classifier.qza
  1. 最后,测试一下分类效果, rep-seqs.qza由前期质控去噪得到
qiime feature-classifier classify-sklearn \
  --i-classifier classifier.qza \
  --i-reads rep-seqs.qza \
  --o-classification taxonomy.qza
#可选
qiime metadata tabulate \
  --m-input-file taxonomy.qza \
  --o-visualization taxonomy.qzv
  1. 柱状图可视化:table.qza由前期质控去噪得到,sample-metadata.tsv如下:
    sample-metadata.tsv
qiime taxa barplot --i-table table.qza \
   --i-taxonomy taxonomy.qza \
   --m-metadata-file sample-metadata.tsv \
   --o-visualization taxa-bar-plots.qzv
taxa-bar-plot

完成

参考:
https://docs.qiime2.org/2020.11/tutorials/feature-classifier/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。

相关阅读更多精彩内容

友情链接更多精彩内容