一、在NCBI上下载rRNA的fasta序列,用于建立索引
1.参考:https://ucdavis-bioinformatics-training.github.io/2017-June-RNA-Seq-Workshop/wednesday/contamination.html
2.下载步骤
2.1 打开NCBI,select “Taxonomy” and search for “Homo sapiens“
2.2 点击 Homo sapiens
2.3 再点一次
2.4 右边表格Click on the “Subtree links” for Nucleotide:
2.5 左边选择rRNA
2.6 下载FASTA 数据
注意:选择显示两百个,让所有记录都放在一页,以便下载全部的条目
另存为:
hg38_rRNA.fasta
二、bowtie2建立rRNA索引
1.解压 hg38_rRNA.fa.gz
2. 建立索引(index)命令:bowtie2-build hg38_rRNA.fa hg38_rRNA
三、利用bowtie2去除rRNA
1.针对单端测序文件(single-end)
命令: bowtie2 -x ~/RNASEQ/index/rRNA_index/hg38_rRNA --un-gz ${i}_IP_rmrRNA.fastq.gz -U ${i}_IP.read1_Clean.fastq.gz -p 8 -S ${i}_rRNA.sam; rm ${i}_rRNA.sam
2.针对双端测序文件(paired-end)
命令:bowtie2 -x ~/RNASEQ/index/rRNA_index/hg38_rRNA --un-conc-gz ${i}_input_rmrRNA.fastq.gz (会生成.1、.2后缀的两个双端文件,就是去除了rRNA的fastq) -1 ${i}_in.read1_Clean.fastq.gz -2 ${i}_in.read2_Clean.fastq.gz -p 8 -S ${i}_rRNA.sam; rm ${i}_rRNA.sam;