BAM比对文件中flags对应的意义

在bam文件中的第二列有这样一些数字,99,147,83,77,141等等,这些数字表示了这条reads的比对的状态。

samtools view FA51.ht2p.bam|less
ST-E00192:599:HHWGGCCXY:3:1101:1032:12842       99      14      49862576        60      149M    =       49862627        200     CAGGCTGGAGTGCAGTGGCTATTCACAGGCGCGATCCCACTACTGATCAGCACGGGAGTTTTGACCTGCTCCGTTTCCGACCTGGGCCGGTTCACCCCTCCTTAGGCAACCTGGTGGTCCCCCGCTCCCGGGAGGTCACCATATTGATG   AAFFAJJJFFJJ<A<AJJJJJJJJFFFJJJJJJFJJJFF<JA7FJFF7FJJFFJAJJJAFJJJJJJJJJFJFAJJJ-FJJFJJ-FJJJJJJJJJJAJJFJJJFFJJJJJFFAJFFJJAFJJ<-AJ<F<JJJJ)FF7<AFJJJ7AAFAJF   AS:i:0  ZS:i:0  XN:i:0  XM:i:0  XO:i:0  XG:i:0  NM:i:0  MD:Z:149        YS:i:0  YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:12842       147     14      49862627        60      149M    =       49862576        -200    ACGGGAGTTTTGACCTGCTCCGTTTCCGACCTGGGCCGGTTCACCCCTCCTTAGGCAACCTGGTGGTCCCCCGCTCCCGGGAGGTCACCATATTGATGCCGAACTTAGTGCGGACACCCGATCGGCATAGCGCACTACAGCCCAGAACT   )<<J<<777-<-))A7))-7FAFFA<A<<<-)))FJFJ<<<7)JJJFJJFFFJAJJJJJJJFFF77-FJJFJ<<<JJJA7FJA<AJ7JJJJJFFFJF<FFAFJJJJJJJJFJF<JJJFFFJAJJFJJJJJJFJFF7JJJFJF-FAFAAA   AS:i:0  ZS:i:0  XN:i:0  XM:i:0  XO:i:0  XG:i:0  NM:i:0  MD:Z:149        YS:i:0  YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:13650       99      12      46365362        60      149M    =       46365521        308     CTAGATGAACATTTACTCAGGTTAGAAGTCGGGTATAAAACAGTGTAACTTTTGTCCTATTACTTGCTCTGGGAAGGCTGCCAGCTGATTCATAACACAAAATGCTTCTCAAAGACTTGATACTAATGCAGGGAACAAAGCTTGTTTGT   AA<AF<FFFJJJ7A-FF77<FJFJJJJJJJJJJ<FJJ-7<FFFFFJJFFJJAFJJJ--<-<FJJJF-F-AAFA7AFFJJJF7<J--FAFJ-JJFFJFJFFFJAJFFAJAFFF7AF-7AJFAAFA7-7FAAFAJ7<AJ-AFA--7AJAJF   AS:i:-6 XN:i:0  XM:i:2  XO:i:0  XG:i:0  NM:i:2  MD:Z:57C1C89    YS:i:-11        YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:13650       147     12      46365521        60      149M    =       46365362        -308    ATCTTATCTTTAAGCACTTTCAGAAAAATTATCCACCAACTTTGAAACAGCTTTAGCATGTAATTTCTAATGCTGGAAACTAAAAAATTTTAAAACAAGTTTTTTTCCAGATGCGTTAGCAAATATTATTAAATATTTCAATGAGGAAA   7------7----A<AFA7<JFA--<7-<---))<JFJF7JJA-7--JJAFA<-<<-AAFA<-7-7A7J7F-FA<7777<--JJAJF--JF<JJFAFAA-<J<AJ--JFFJFJF7-JJFFJJJF<FFFJJJJ<FF7--FFF-7A7AA<AA   AS:i:-11        XN:i:0  XM:i:4  XO:i:0  XG:i:0  NM:i:4  MD:Z:30G1A11G0T103      YS:i:-6 YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:14600       99      14      49862566        60      149M    =       49862682        262     CTATGTTGCTCAGGCTGGAGTGCAGTGGCTATTCACAGGCGCGATCCCACTACTGATCAGCACGGGAGTTTTGACCTGCTCCGTTTCCGACCTGGGCCGGTTCACCCCTCTTTAGGCAACCTGGTGGTCCCCCGCTCCCGGGAGGTCAC   AAF<FFJJAF7AJ<JJJJ77<AFJ-7AJ7FJFJ7<<<FJJ-AFJJJJJ<-F-<FFA7FJAJJJFJFA<7<FFFFJFJJJFFJJJFJFJJJJAJAJJ<AJJAJJAJJJJJF-AFAFFFFJFFJFFJJFJ<7F<)-)--JF7JFJAFJ77<   AS:i:-3 ZS:i:-8 XN:i:0  XM:i:1  XO:i:0  XG:i:0  NM:i:1  MD:Z:110C38     YS:i:0  YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:14600       147     14      49862682        60      146M    =       49862566        -262    CAACCTGGTGGTCCCCCGCTCCCGGGAGGTCACCATATTGATGCCGAACTTAGTGCGGACACCCGATCGGCATAGCGCACTACAGCCCAGAACTCCTGGGCTCAAGCGATCCTCCCACCTCAGCCTCCCGAGTAGCTGGGACTACA      FJAFF7F77J<-F7JJFF7)JF<<<)J7<7JAF77-F<A)7)JJF-FJA-JAA7-A--JFAJAA7777--7AJF<JJJJAAFJJJF7-A-AAJF<F<A7-<AFA7-A<<-<F7FJ<AF7-JFFJA-JFJF<AJJFA7A-JJF7J<F      AS:i:0  ZS:i:0  XN:i:0  XM:i:0  XO:i:0  XG:i:0  NM:i:0  MD:Z:146        YS:i:-3 YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:14846       99      14      49853665        60      41M8935N108M    =       49853729        9020    ACAGGCGCGATCCCACTACTGATCAGCACGGGAGTTTGGACCTGCTCCGTTTCCGACCTGGGCCGGTTCACCCCTCCTTAGGCAACCTGGTGGTCCCCCGCTCCCGGGAGGTCACCATATTGATGCCGAACTTAGTGCGGACACCCGAT   AAFFJAJJAJJ7JJJJJ7JJJJJJJJJJJFJJFJJJJ-F<-7AJA7F<FJJJA-FJ-<FJJJJFJJJJJA-7FJJJJJJAAJJJAJJJJJJJJF--7A<FJ7FJJJJJJJFFFJ<FJJJJJJ-7F7-AJFJFFFJJJJJJ<))A-AA))   AS:i:-8 ZS:i:-3 XN:i:0  XM:i:2  XO:i:0  XG:i:0  NM:i:2  MD:Z:8A28T111   YS:i:-5 YT:Z:CP XS:A:-  NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:14846       147     14      49853729        60      46M8935N103M    =       49853665        -9020   GGTTCCCCCCTCCTTAGGCAACCTGGTGGTCCCCCGCTCCCGAGAGGTCACCATATTGATGCCGAACTTAGTGCGGACACCCGATCGGCATAGCGCACTACAGCCCAGAACTCCTGGGCTCAAGCGATCCTCCCACCTCAGCCTCCCGA   --7<-))<<7--FFF<7)A7<A777FF-7)JF<<)<-7J<<7-AFF7FF--FF<A---7F-JJFAFA-AJJJJFFA7777<JF<<AF-FF-<AA--FJJFJJJJJFF7JJFAJJA-AJF7JJJJFAA-JFAFFFFJJ<FFJJAAJFAAA   AS:i:-5 ZS:i:-5 XN:i:0  XM:i:2  XO:i:0  XG:i:0  NM:i:2  MD:Z:5A36G106   YS:i:-8 YT:Z:CP XS:A:+  NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:14986       99      14      49862563        60      148M1S  =       49862662        245     TCGCTATGTTGCTCAGGCTGGAGTGCAGTGGCTATTCACAGGCGCGATCCCACTACTGATCAGCATGGGAGTTTTGACCTGCTCCGTTTCCGACCTGGGCCGGTTCACCCCTCCTTAGGCAACCTGGTGGTCCCCCGCTCCCGGGAGGG   AAF7AJJFJJ<FF7FFJFAFJJJFJ-FJJ--FJJJJJ<F7-AJJ<JJJ-7FJF-FJFJJJ-7F---<--AJAJJJJJJJAJ<JAAJAJFFFJJAJJ7J-77FFJFJJJJ-7A-7FJFJJFFJJAFFJAJJJFFJJJ)7AFJJJJJAJJ-   AS:i:-4 ZS:i:-9 XN:i:0  XM:i:1  XO:i:0  XG:i:0  NM:i:1  MD:Z:65C82      YS:i:-5 YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:14986       147     14      49862662        60      138M79055N8M    =       49862563        -245    CCGGTTCACCCCTCCTTAGACAACCTGGTGGGCCCCCGCTCCCGGGAGGTCACCATATTGATGCCGAACTTAGTGCGGACACCCGATCGGCATAGCGCACTACAGCCCAGAACTCCTGGGCTCAAGCGATCCTCCCACCTCAGCCT      )7<--<-))-A-<-<-<A<-AJAA<7-<-)-)-A-FFJA)7-<)7)<)7--AJJFJFFA-77AJ7-JJFAJJJAJJJJF77FJAFFJAAJFJFFA<AF7AF<JF-<<JFJF-AJAAAA-AJJAJA-7-7F77-FJFFA7AF-AFA-      AS:i:-5 ZS:i:-5 XN:i:0  XM:i:2  XO:i:0  XG:i:0  NM:i:2  MD:Z:19G11T114  YS:i:-4 YT:Z:CP XS:A:-  NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:15373       83      14      49586700        60      149M    =       49586621        -228    TTCGGCATCAATATGGTGACCTCCCGGGAGCGGGGGACCACCAGGTTGCCTAAGGAGGGGTGAACCGGCCCAGGTCGGAAACGGAGCAGGTCAAAACTCCCGTGCTGATCAGTAGTGGGATCGCGCCTGTGAATAGCCACTGCACTCCA   FJJAFFAAJJJJJJJ<--)JJAJAAAFJA<FAAF7FJJJJJJJJJJJJJJFJJJJJJJJJAA77JJJJJJJJJJFJJFFJFJJJJJJJJJJJJJF-J7JJJJJJJJJ<JJJJFJJJJJAJFJ<<JJJJJJJJJFJJJJ7JJJJJF<AAA   AS:i:0  ZS:i:0  XN:i:0  XM:i:0  XO:i:0  XG:i:0  NM:i:0  MD:Z:149        YS:i:0  YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:15373       163     14      49586621        60      149M    =       49586700        228     GAGGCTGAGGCTGGAGGATCGCTTGAGTCCAGGAGTTCTGGGCTGTAGTGCGCTATGCCGATCGGGTGTCCGCACTAAGTTCGGCATCAATATGGTGACCTCCCGGGAGCGGGGGACCACCAGGTTGCCTAAGGAGGGGTGAACCGGCC   AAAFF<JJJJJFJJJJJJAJJJFFJJJJJJFJJJJJJJJJJJJFJJJJJJJJJFJFJA7FFFJFJJFJA--FFA7AJ<JA7AJA<AAFJJFJFJF<FAJJJJ77FJJ7AAFJJJF--)A<A7AJA<FAA-A7AF<FFJJAJF-7-AF<<   AS:i:0  ZS:i:0  XN:i:0  XM:i:0  XO:i:0  XG:i:0  NM:i:0  MD:Z:149        YS:i:0  YT:Z:CP NH:i:1
ST-E00192:599:HHWGGCCXY:3:1101:1032:17483       77      *       0       0       *       *       0       0       GAGGAGTTATTGGGGTTGAATTTGCACAAATATTTGCAACCGCAGGAACAAAAGTTACTATTTTACAAAACCTACCATTAATTTTAGCTAACCTTGATAGTGAAATTTCAAAGCAATTAAGTGCTAATTTAGAAAAATTAGGTGTAAAA   AAAFFFAF<FFJAJAF<JJJJJJFJJJJJAJ-JJ-F-<JJJAFJJJJJ-FJJJFJJJ<J<JJJJJJJ---AFJA7JJJJJFJJJJFJJJJJJ<JJJJJJAJJFJAJJJFA<-77FF-FJJJJ7<FFAAAJAJ-7-77AFAFJJJJJJJF   YT:Z:UP
ST-E00192:599:HHWGGCCXY:3:1101:1032:17483       141     *       0       0       *       *       0       0       TCAGATTTAATTCTGTGTTCTTGATTATCAACTGTGTAAACAACTTCATCGTTTTCAAATCTTTGAGTTGTTGCATTTGTAACGATTTTTACACCTAATTTTTCTAAATTAGCACTTACTTGCTTTGAAATTTCACTATCAAGGTTAGC   AAAFJAJJJJFJJJFJJJF-FFF-FFJJJJ-FJJJJFJF<AJJFJJF7F-FFJJJFJJJJ<JJJJ-FFJ-FJAF-AJJJJJJJJJJJJFJFFF--A-7FFFJJAAJJ7FFJJA--7A--<FA-<<FFAF-<7AFJ-7-<-<7F<F-<F-   YT:Z:UP

以下以双末端测序的bam文件为例,这些数字表示的意义分为3种类型:

1.两条reads都比对上

99=1+2+32+64:该对reads都比对到基因组,这是read1,比对到参考基因组正链
147=1+2+16+128:该对reads都比对到基因组,这是read2,比对到参考基因组负链

83=1+2+16+64:该对reads都比对到基因组,这是read1,比对到参考基因组负链
163=1+2+32+128:该对reads都比对到基因组,这是read2,比对到参考基因组正链

2. 两条reads都没有比对上

77=1+4+8+64:该对reads都没有比对到参考基因组,这是read1
141=1+4+8+128:该对reads都没有比对到参考基因组,这是read2

3. 两条reads有一条没有比对上,另一条比对上

69=1+4+64:该对reads中的read1,没有比对到参考基因组,与其配对的read2比对到参考基因组正链
153=1+8+16+128:该对reads中的read2,比对到参考基因组正链,与其配对的read1没有比对到参考基因组

89=1+8+16+64:该对reads中的read1,比对到参考基因组负链,与其配对的read2没有比对到参考基因组
133=1+4+128:该对reads中的read2,没有比对到参考基因组,与其配对的read1比对到参考基因组负链

每个数字都是由2的n次方相加而来,即等号后的数字。可通过samtools flags +数字查看。

samtools flags 1
#0x1    1   PAIRED
samtools flags 2
#0x2    2   PROPER_PAIR
samtools flags 4
#0x4    4   UNMAP
amtools flags 8
#0x8    8   MUNMAP
samtools flags 16
#0x10   16  REVERSE
samtools flags 32
#0x20   32  MREVERSE
samtools flags 64
#0x40   64  READ1
samtools flags 128
#0x80   128 READ2
samtools flags 256
#0x100  256 SECONDARY
samtools flags 512
#0x200  512 QCFAIL
samtools flags 1024
#0x400  1024    DUP
samtools flags 2048
#0x800  2048    SUPPLEMENTARY

解释为:

1:The read is one of a pair
2:The alignment is one end of a proper paired-end alignment
4:The read has no reported alignments
8:The read is one of a pair and has no reported alignments
16:The alignment is to the reverse reference strand
32:The other mate in the paired-end alignment is aligned to the reverse reference strand
64:The read is mate 1 in a pair
128:The read is mate 2 in a pair

翻译如下:

1(1)双末端测序
2(10)paired reads都正确比对到参考序列上
4(100)该read没比对到参考序列上
8(1000)与该read成对的另一条read没有比对到参考序列上
16(10000)该read比对到参考序列负链

32(100000)与该read成对的另一条read比对到参考序列负链
64(1000000)该read是成对reads中的read1
128(10000000)该read是成对reads中的read2

Flags表示的意义可以用下图概括

Flags表示的意义.png

参考:
SAM Format Flag

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容

  • 可以使用samtools fastq命令从bam文件中提取特定的fastq序列。使用帮助 Flags对应的意义如下...
    佳名阅读 5,698评论 0 7
  • SAM(The Sequence Alignment / Map format)格式,即序列比对文件的格式,详细介...
    oddxix阅读 1,692评论 0 1
  • SAM分为两部分,注释信息(header section)和比对结果部分(alignment section)。 ...
    苏牧传媒阅读 7,527评论 0 2
  • 夏未凉风秋未至,隔江万里君不识。 (说明:这是去年夏秋之季,秋的步伐在靠近,夏天的尾巴却还在停留。彼时正在一个群里...
    木决阅读 223评论 4 5
  • 或举手投足 或四目相对 或笑意逢春 或倩影撩拨 一念起 或辗转反侧 或如痴如醉 或满面春风 或反复无常 遂执于念 ...
    跳动的音符_8869阅读 222评论 3 6