整理植物rRNA序列库

在刚接触生信的时候,测到的第一套数据就发现有一定量的rRNA,那会就找了silva数据库,经过查看文档,可以通过以下命令整理,得到泛植物的rRNA序列库。可用于去除rRNA污染,或者评估

aria2c -j 20 https://www.arb-silva.de/fileadmin/silva_databases/release_132/Exports/SILVA_132_SSUParc_tax_silva_trunc.fasta.gz
aria2c -j 20 https://www.arb-silva.de/fileadmin/silva_databases/release_132/Exports/SILVA_132_LSUParc_tax_silva_trunc.fasta.gz
pigz -d *
cat *.fasta|perl -ne 'BEGIN{$id=q{};$seq=q{}}chomp;if(/^>/){print $id,qq{\n},$seq,qq{\n} if ($id=~/Eukaryota;Archaeplastida/);$id=$_;$seq=q{}}else{$seq.=$_;}END{print $id,qq{\n},$seq,qq{\n} if ($id=~/Eukaryota;Archaeplastida/)}'|perl -pe 'tr/U/T/ unless /^>/' > panPlant.rRNA.fa
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 8种特殊建库测序 8种特殊建库测序 1. RNA-seq 2. 外显子测序 3. small RNA-seq 4....
    wangchuang2017阅读 14,526评论 2 92
  • 参考学习《R语言与Bioconductor生物信息学应用》第六章 前言 Y叔的公众号biobabble发过一篇【听...
    王诗翔阅读 14,701评论 0 49
  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 32,120评论 2 89
  • 原文来自:聊聊转录组测序——2.数据分析与解读(上) 流程概览 转录组测序的分析流程大致可以分成三类,包括基因组比...
    简单点lili阅读 8,983评论 0 14
  • 文/云海清清 军耀下乡后的第一个晚上,是在村里的老乡殷柱家过夜的,黑咕隆咚的小地方点着煤油灯,村支书说今晚上...
    云海清清阅读 3,446评论 2 2