1. 利用RepeatMasker 对基因组进行注释
# 运行 RepeatMasker
RepeatMasker \
--species Viridiplantae \
-e rmblast \
-pa 10 \
-qq \ # -s -q -qq ,更快,更不准
genome.fa 1>repeatmasker.log 2>&1
2. 结果转换为 bed 格式
image.png
/pub/software/opt/RepeatMasker/util/RM2Bed.py genome.fa.out
image.png
物 种 选 择
RepeatMasker 支持的物种可以通过 queryTaxonomyDatabase.pl 搜索。
perl /pub/software/RepeatMasker/util/queryTaxonomyDatabase.pl \
-species "Viridiplantae"
###Viridiplantae是指含有叶绿素的非单细胞植物
RepeatMasker Taxonomy Database Utility
======================================
Species = citrus
Lineage = Citrus
Aurantioideae
Rutaceae
Sapindales
malvids
rosids
Pentapetalae
Gunneridae
eudicotyledons
Mesangiospermae
Magnoliophyta
Spermatophyta
Euphyllophyta
Tracheophyta
Embryophyta
Streptophytina
Streptophyta
Viridiplantae
Eukaryota
cellular organisms
root