1、转录在数据比对软件STAR是ENCODE计划(ENCyclopedia Of DNA Elements,人类基因组DNA元件百科全书计划)的御用pipeline工具。相对于hisat2,TopHat2 比对准确率稳定性最佳,但是耗内存.
网站下载最新版(https://github.com/alexdobin/STAR/releases/tag/2.7.10b)
解压
tar -xzf 2.7.10b.tar.gz
cd STAR-2.7.10b
cd /opt/biosoft/STAR-2.7.10b/source
make STAR
添加到环境变量
echo 'PATH=$PATH:/opt/biosoft/STAR-2.7.10b/source/' >> ~/.bashrc
建立基因组索引,基因组比较大,内存设大一些--limitGenomeGenerateRAM
STAR --runMode genomeGenerate --runThreadN 40 --limitGenomeGenerateRAM 61391328864 --genomeDir ~/star/As_index --sjdbOverhang 149 --genomeFastaFiles ~/garlic_SRA/As.fa --sjdbGTFfile ~/genome/garlic/Asa.gtf