生信log7|用barrnap在细菌全基因组中抽取16sr RNA 序列

使用软件:barrnap(需要在合适的环境中配合运行)

barrnap其实 除了自己一个文件以外,还会配合bedtools来抽取fasta中的序列,否则会因为格式问题报错而不产生所需的文件

准备文件:

  • contig.fasta(就是拼好的序列scaffold.fasta也可以用的)
  • 注释好的.gff3文件

软件安装

Conda
conda install -c bioconda -c conda-forge barrnap
Homebrew(MacOS/Linux用户)
brew install brewsci/bio/barrnap
到底需不需要特意去安装呢,笔者认为是不需要的,因为这个软件内置在微生物注释常用软件Prokka内,意味着使用prokka进行初步注释后已经可以抽取16S rRNA基因序列了

常用代码/命令

# 查看帮助
barrnap -h
# contigs.fa 输入的是拼接好的菌种.fasta的文件,两边的 'rrna.fa', 'rrna.gff'是为了
# 把gff上的信息与序列信息相对应)-o 是输出文件名&地址
barrnap -o output.fa contigs.fa your_species.gff 
##查看序列头三行
head -n 3 rrna.fa 

得到下列结果

16S_rRNA::gi|329138943|tpg|BK006945.2|:455935-456864(-)
ACGGTCGGGGGCATCAGTATTCAATTGTCAGAGGTGAAA
TTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTG
CCAAGGACGTTTTCATTA

如何验证
  • 建议自己先做个16S rRNA的测序,并上传至Ezbiocloud进行序列比对。后面从基因组中抽出来的序列也上传至Ezbiocloud进行序列比对,看种属信息是否一致。(PS:Ezbiocloud/NCBI都可以,看自己个人喜欢)

参考

下面的网址是官方详细的教程
https://github.com/tseemann/barrnap/blob/master/README.md#barrnap

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容