GATK's Pipeline for calling variants with rnaseq data

#!/usr/bin/sh

genome=/home/chenfan/mnt/sdc/RNAseq/hs37d5.fasta

refgene=/home/chenfan/mnt/sdc/RNAseq/hg19_Refgene.gtf

picard=/home/chenfan/mnt/sdc/RNAseq/picard.jar

gatk=/home/chenfan/mnt/sdc/RNAseq/GenomeAnalysisTK.jar

knownindel=/home/chenfan/VQSR/data/Mills_and_1000G_gold_standard.indels.b37.vcf

knownsnp=/home/chenfan/VQSR/data/1000G_phase1.snps.high_confidence.b37.vcf

result_path=/home/chenfan/mnt/sdc/RNAseq/result

#------------------------------STAR 2-pass alignment steps-----------------------------------------

echo "------------------------------STAR 2-pass alignment steps-----------------------------------------"

in_dir=${result_path}/1_bamtofastq_output

out_dir=${result_path}/2_star_output

cd ${out_dir}/1index

STAR --runMode genomeGenerate --genomeDir ${out_dir}/1index --genomeFastaFiles $genome --sjdbGTFfile $refgene --runThreadN 30

cd ${out_dir}/1pass

STAR --genomeDir ${out_dir}/1index --readFilesIn ${in_dir}/1.fastq  ${in_dir}/2.fastq --runThreadN 30

cd ${out_dir}/2index

STAR --runMode genomeGenerate --genomeDir ${out_dir}/2index --genomeFastaFiles $genome --sjdbFileChrStartEnd ${out_dir}/1pass/SJ.out.tab --sjdbOverhang 154 --runThreadN 30

cd ${out_dir}/2pass

STAR --genomeDir ${out_dir}/2index --readFilesIn ${in_dir}/1.fastq ${in_dir}/2.fastq  --runThreadN 30

#------------------------------Picard add read groups,sort,mark duplicates,and create index-----------------------------------------

echo "------------------------------Picard add read groups,sort,mark duplicates,and create index-----------------------------------------"

in_dir=${out_dir}

out_dir=${result_path}/3_picard_output

cd ${out_dir}

java -jar $picard AddOrReplaceReadGroups I=${in_dir}/2pass/Aligned.out.sam O=${out_dir}/sort_addRG_align.bam SO=coordinate RGID=hap1 RGLB=rnaseq RGPL=illumina RGPU=runname RGSM=C20

java -jar $picard MarkDuplicates I=${out_dir}/sort_addRG_align.bam O=${out_dir}/markdup_sort_addRG_align.bam  CREATE_INDEX=true VALIDATION_STRINGENCY=SILENT M=${out_dir}/output.metrics

#-------------------------------SplitNCigarReads---------------------------------------

echo "------------------------------SplitNCigarReads-----------------------------------------"

in_dir=${out_dir}

out_dir=${result_path}/4_splitncigarReads_output

cd ${out_dir}

java -jar $gatk -T SplitNCigarReads -R $genome -I ${in_dir}/markdup_sort_addRG_align.bam -o ${out_dir}/split_markdup_sort_addRG_align.bam -rf ReassignOneMappingQuality -RMQF 255 -RMQT 60 -U ALLOW_N_CIGAR_READS

#-------------------------------Indel Realignment ---------------------------------------

echo "------------------------------Indel Realignment -----------------------------------------"

in_dir=${out_dir}

out_dir=${result_path}/5_indelrealign_output

cd ${out_dir}

java -jar $gatk \

-T RealignerTargetCreator \

-nt 32 \

-R $genome \

-I ${in_dir}/split_markdup_sort_addRG_align.bam \

-o ${out_dir}/realign_interval.list \

-known $knownindel

java -jar $gatk \

-T IndelRealigner \

-R $genome \

-I ${in_dir}/split_markdup_sort_addRG_align.bam \

-known $knownindel \

-o ${out_dir}/realign_split_markdup_sort_addRG_align.bam \

-targetIntervals ${out_dir}/realign_interval.list

#-------------------------------Base Recalibration---------------------------------------

echo "------------------------------Base Recalibration-----------------------------------------"

in_dir=${out_dir}

out_dir=${result_path}/6_bqsr_output

cd ${out_dir}

java -jar $gatk \

-T BaseRecalibrator \

-nct 32 \

-R $genome \

-I ${in_dir}/realign_split_markdup_sort_addRG_align.bam \

-knownSites $knownsnp \

-knownSites $knownindel \

-o ${out_dir}/recal_data.table

java -jar $gatk \

-T PrintReads \

-nct 32 \

-R $genome \

-I ${in_dir}/realign_split_markdup_sort_addRG_align.bam \

-BQSR ${out_dir}/recal_data.table \

-o ${out_dir}/bqsr_realign_split_markdup_sort_addRG_align.bam

#-------------------------------Variant calling---------------------------------------

echo "------------------------------Variant calling-----------------------------------------"

in_dir=${out_dir}

out_dir=${result_path}/7_callvariants_output

cd ${out_dir}

java -jar $gatk \

-T HaplotypeCaller \

-nct 32 \

-R $genome \

-ploidy 1 \

-I ${in_dir}/bqsr_realign_split_markdup_sort_addRG_align.bam \

-dontUseSoftClippedBases \

-stand_call_conf 20.0 \

-o ${out_dir}/Hap1_rnaseq.vcf

#-------------------------------Variant filtering---------------------------------------

echo "------------------------------Variant filtering-----------------------------------------"

in_dir=${out_dir}

out_dir=${result_path}/8_filtervariants_output

cd ${out_dir}

java -jar $gatk \

-T VariantFiltration \

-R $genome \

-V ${in_dir}/Hap1_rnaseq.vcf \

-window 35 \

-cluster 3 \

--filterName FS -filter "FS>30.0" \

--filterName QD -filter "QD<2.0" \

-o ${out_dir}/filtered_Hap1_rnaseq.vcf

java -jar $gatk \

-T SelectVariants \

-ef \

-R $genome \

-V ${out_dir}/filtered_Hap1_rnaseq.vcf \

-o ${out_dir}/ef_Hap1_C20_rnaseq.vcf

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355

推荐阅读更多精彩内容

  • #!/bin/bash PICARD=/home/lq/storage/call_variants/softwar...
    晨语凡心阅读 973评论 0 3
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,657评论 18 139
  • Introduction What is Bowtie 2? Bowtie 2 is an ultrafast a...
    wzz阅读 5,660评论 0 5
  • 孩子,高考来临之即,我和妈妈不想用“学习砥砺人生,高考决定命运”等这样的口号来教导你。 我深深记得有一位作家...
    晨熙_88f9阅读 1,122评论 0 2
  • 朋友,一生中会分好几个阶段,每个阶段你都会结实新朋友。但请别忘了老朋友。 我从小学到大学,遇到所有的人又有...
    婳_阅读 140评论 0 0