关于bam文件第二列的flags:
第一列代表的是二进制,我们在bam文件里看到的其实是十进制,下面有个例子,讲述了怎么把十进制转成二进制。但是我不明白第二列为什么是0*1,0*2等等。
比如bam文件里的flag是1169,我们把它转变成二进制,并且对应到每个description.
#bam flag 1169
echo'obase=2;1169'| bc ====== 10010010001
把这个二进制倒着按下表的顺序,1的话,就代表这个情况存在。
如果segment1指的是read1, next segment指的就是read2.
为什么说是反链呢?我们都知道DNA的合成方向是从5’到3’的,正链=有义链=模板连=序列和mRNA序列相同,反链=无义链=编码链=编码mRNA的链。
但是我有两个疑问,参考基因组写的那个是哪条链?全部是反义连?等到自己想明白了,在回答吧。
先记录这个链接:https://www.cnblogs.com/xudongliang/p/5437850.html