前言
转录组分析时,在比对参考前,我们需要进行比对核糖体的rRNA,并去除
对于一些没有rRNA注释的物种,我们可以下载近缘物种的rRNA,也可以从头预测
于是我们用到barrnap(BAsic Rapid Ribosomal RNA Predictor)
github主页:https://github.com/tseemann/barrnap
1 barrnap的安装
安装非常简单,以wsl ubuntu x86_64为例
conda install -c bioconda barrnap
不过我在使用时发现了一个坑,那就是barrnap需要bedtools版本>= 2.27.0,但是conda不知道为什么给我自动安装的是2.26.1,导致后面输出rRNA的fasta时报错
所以最好看一下bedtools版本
bedtools --version
如果不符合依赖的要求,那还得手动编译一下,此乃Linux特色不得不品尝
wget https://github.com/arq5x/bedtools2/releases/latest/download/bedtools.tar.gz
tar -zxvf bedtools.tar.gz
cd bedtools2
make
如果编译过程中提示出错,那大概率是wsl缺失xx库的锅,我遇到的有以下:
sudo apt update
sudo apt install zlib1g-dev # 少了zlib
sudo apt install libbz2-dev # 少了bzip2
sudo apt install liblzma-dev # 少了liblzma
# 真的无语
# 安装完成后把编译安装的bedtools添加到系统变量,暂时性
export PATH=/home/yuntaozhu/bedtools2/bin:$PATH
# 或者永久性
nano ~/.bashrc
# 在文件的末尾添加:export PATH=/home/yuntaozhu/bedtools2/bin:$PATH
# 按Ctrl+X,Y,保存,然后重新加载
source ~/.bashrc
2 使用barrnap
barrnap --kingdom euk --threads 8 --outseq /mnt/e/Sophora_japonica_genome/genome_true/Sja_rRNA.fasta /mnt/e/Sophora_japonica_genome/genome_true/Sja.Chr.fasta > /mnt/e/Sophora_japonica_genome/genome_true/Sja_rRNA.gff3
其中,--kingdom后面接物种类型,euk表示真核生物(具体查github主页)
--outseq接rRNA导出的fasta文件名称
--threads表示多线程,默认1
最后两个分别是输入的基因组fasta和导出的gff注释
3 总结
有了rRNA的fasta就方便比对核糖体了
但是一定要注意bedtools版本的问题,否则疯狂报错!