根据文章提供的SRA去下
从SRA下载的数据竟然是lite.1格式
需要sra-tools最新版本解压,偷偷下在我文件夹下了
/storage2/anlei/wangwenjing/lml/sratoolkit.3.0.2-ubuntu64/bin/fastq-dump --split-3 $SRR.lite --gzip
解压出来就是_1 _2两个双端数据
1、TrimGlore过滤
trim_galore -q 25 --phred33 --length 35 -e 0.1 --stringency 3 --paired -o /storage2/anlei/wangwenjing/lml/trim_clean SRR12730680.lite.1_1.fastq.gz SRR12730680.lite.1_2.fastq.gz
2、Hisat2比对
首先需要建立索引,NCBI下载的fa基因组和gtf注释
extract_exons.py genomic.gtf >genome.exon.gtf
extract_splice_sites.py genomic.gtf > genome.ss.gtf
hisat2-build GCF_002917755.1_EL10_1.0_genomic.fa -p 10 --ss genome.ss.gtf --exon genome.exon.gtf /sugar_index
以上是甜菜index的建立
hisat2 -p 20 -x /storage2/anlei/wangwenjing/index/hisat2/sugar/sugar_index/sugar -1 SRR12730680.lite.1_1_val_1.fq.gz -2 SRR12730680.lite.1_2_val_2.fq.gz -S SRR12730680.sam
3、sam转bam
samtools sort -O bam -@ 25 SRR12730680.sam -o /storage2/anlei/wangwenjing/lml/hisat2_bam/SRR12730680.sort.bam
4、featurecount计算counts数
featureCounts -T 40 -g gene_id -a /storage2/anlei/wangwenjing/index/hisat2/sugar/sugar_index/genomic.gtf -o /storage2/anlei/wangwenjing/lml/count/SRR12730680_count.txt SRR12730680.sort.bam