NGS数据比对之BWA

BWA主要是将reads比对到大型基因组上,主要功能是:序列比对。首先为大型参考基因组建立索引,然后将reads比对到基因组。特点是快速、准确、省内存。由三种类似算法组成:BWA-backtrack,BWA-SW和BWA-MEM。首推BWA-MEM。

三种算法的适用范围

BWA-backtrack:reads长度<70bp时,推荐本算法,建议输入reads长度 < 100bp。
BWA-SW:在reads具有频繁的gap时,比对更敏感,推荐本算法。reads长度一般为70bp-1Mbp,支持long-reads,split alignment。
BWA-MEM(首推):在reads长度在70bp-1Mbp范围时,推荐本算法(除了上面两种情况)。支持long-reads,split alignment。

BWA使用说明 使用手册

语法
bwa index ref.fa #首先建立基因组索引
bwa mem ref.fa reads.fq > aln-se.sam # 调用BWA-MEM
bwa mem ref.fa read1.fq read2.fq > aln-pe.sam # 调用BWA-MEM
bwa aln ref.fa short_read.fq > aln_sa.sai # 调用BWA-backtrack
bwa samse ref.fa aln_sa.sai short_read.fq > aln-se.sam # 调用BWA-backtrack
bwa sampe ref.fa aln_sa1.sai aln_sa2.sai read1.fq read2.fq > aln-pe.sam # 调用BWA-backtrack
bwa bwasw ref.fa long_read.fq > aln.sam # 调用BWA-SW
注意:BWA输入的是fastq/fq的原始测序数据。

bwa的使用需要两个 输入文件
Reference genome data 和 Short reads data

Step1.建立索引

根据reference genome data 建立 Index File

bwa index -a bwtsw reference.fa   

##bwa index [-p prefix] [-a algoType] <in.db.fasta>
bwa index -a is TP53.fna

构建索引时需要注意的问题:bwa构建索引有三种算法,三种算法都是基于BWT的,这三种算法通过参数
-a is 、-a div和-a bwtsw进行选择。其中-a bwtsw对于短的参考序列是不工作的,必须要大于等于10Mb;-a is(效果和-a div是一样的)是默认参数,这个参数不适用于大的参考序列,必须要小于等于2G。

Step2.比对 bwa mem
image.png
module add bwa
module add broad_hg38/bwa
SAMPLE=S001P1
RESULT_ROOT="sunyq"

echo "bwa starts at `date`"
bwa mem -R "@RG\\tID:${SAMPLE}\\tCN:NovoGene\\tLB:SureSelectHumanAllExonV6r2\\tPL:Illumina\\tSM:${SAMPLE}" \
        -K 100000000 -v 3 -t 2 -Y \
          $GENOME_LOCAL/$GENOME_NAME \
          S001P1_1.fq.gz \
          S001P1_2.fq.gz \
       -o ${RESULT_ROOT}/${SAMPLE}_bwa_hg38.sam

echo "bwa ends at `date`"

需要参考基因组以及原始fastq文件,输出sam文件格式

sam文件解读:

read包含:


image.png

FLAG字段中的定义为:


image.png

BWA生成以下可选字段。以“X”开头的标签是特定于BWA的。


image.png

使用bwa完成比对后,用samtools完成BAM格式转换、排序并标记PCR重复序列。

例子:利用 SRR1770413 ,见WES数据处理之寻找突变GATK

bwa index -a is  E.coli_K12_MG1655.fa  #创建参考基因组索引

module add bwa

bwa mem -R "@RG\tID:foo\tPL:illumina\tSM:E.coli_K12" -t 2 /home/linjc/jianshu/WES/E.coli_K12_MG1655.fa \
          /home/linjc/jianshu/WES/SRR1770413/E_Coli_CGATGT_L001_R1.fastq.gz \
          /home/linjc/jianshu/WES/SRR1770413/E_Coli_CGATGT_L001_R2.fastq.gz \
       -o /home/linjc/jianshu/WES/E_Coli_CGATGT_bwa.sam

samtools view -Sb E_Coli_CGATGT_bwa.sam > E_Coli_CGATGT_bwa.bam  #转换为bam文件

#排序
samtools sort -@ 4 -m 4G -O bam -o /home/linjc/jianshu/WES/E_coli_K12.sorted.bam /home/linjc/jianshu/WES/E_Coli_CGATGT_bwa.bam   

#标记重复PCR  module add gatk/4.2.6.1
gatk MarkDuplicates -I /home/linjc/jianshu/WES/E_coli_K12.sorted.bam -O /home/linjc/jianshu/WES/E_coli_K12.sorted.markdup.bam -M /home/linjc/jianshu/WES/E_coli_K12.sorted.markdup_metrics.txt

#创建比对索引文件
samtools index /home/linjc/jianshu/WES/E_coli_K12.sorted.markdup.bam
image.png

以上为BWA比对流程,排序,标记等

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容