建立索引
STAR --runThreadN 6 --runMode genomeGenerate \
--genomeDir ~/rnaseq/mouse_STAR_index \
--genomeFastaFiles ~/rnaseq/mouse_ref/mm10.fa \
--sjdbGTFfile ~/rnaseq/mouse_ref/gencode.vM25.annotation.gtf \
--sjdbOverhang 149
--genomeDir:索引目录。(index_dir一定要是存在的文件夹,需提前建好)
--genomeFastaFiles:基因组文件
--sjdbGTFfile:基因组注释文件
--sjdbOverhang:reads长度减1
获得新的数据要检查一下长度,决定是否要改变--sjdbOverhang 的参数
比对
STAR --runThreadN 5 --genomeDir ~/rnaseq/mouse_STAR_index \
--readFilesCommand zcat \
--readFilesIn ~/data_new/Old72_R1.fq.gz ~/data_new/Old72_R2.fq.gz \
--outFileNamePrefix ~/rnaseq/STAR_OUT/O72_STAR_out/O72_ \
--outSAMtype BAM SortedByCoordinate \
--outBAMsortingThreadN 5 \
--quantMode TranscriptomeSAM GeneCounts
--readFilesCommand zcat 解压原始文件
--readFilesIn 原始文件的路径及原始文件
-- genomeDir index的文件路径
--outSAMtype BAM SortedByCoordinate 不输出Sam文件而是输出bam文件,排序
--quantMode 把基于基因组比对的信息转换为基于转录组比对的信息
bah文件
vim map.sh #创建一个bash文件并进入编辑
---------------------------------------------------------------------------------------
#!/bin/bash
for i in {43..49}
do STAR --runThreadN 5 --genomeDir ~/rnaseq/mouse_STAR_index --readFilesCommand zcat --readFilesIn ~/data_new/Young${i}_R1.fq.gz ~/data_new/Young${i}_R2.fq.gz --outFileNamePrefix ~/rnaseq/STAR_OUT/Y${i}_STAR_out/Y${i}_ --outSAMtype BAM SortedByCoordinate --outBAMsortingThreadN 5 --quantMode TranscriptomeSAM GeneCounts
done
-------------------------------------------------------------------------
# 按Esc键,:,wq 退出编辑器
chmod +x map.sh #为bash文件赋予可执行权限
ls #如果”map.sh“显示为绿色,则表明获得执行权限