写在前面的废话
有时候我在读文献时,明明前面用的是alignment,但是接下来又使用了mapping。起初,我认为二者意思相同,后来发现没那么简单。无奈之下只能自己搜集资料思考二者的区别……
太长不看系列
- alignment:讲究细节,需要知道比对的具体情况
- mapping:只看整体,不关注比对的具体情况
废话超多系列
alignment vs. mapping
alignment与mapping之间的区别
当我们要比对(align)一个read时,我们不仅要知道它在基因组中可能出现的位置,而且还要知道对应位置的确切碱基。举一个例子,一个read seq1
很有可能来源于1号染色体,其坐标位置从123到140。seq1
read中的前7个碱基与参考基因组精确比对上,接着有3个碱基的插入,接着剩余的碱基read seq1
和参考基因组比对上。
上面的例子中,我们知道这个reads比对的具体信息(具体位置,是否错配,有无indel等),此时我们对这种比对情况称之为alignment。
而当我们匹配(mapping)一个read时,我们仅仅需要知道read它来自哪里,而不关心read和reference之间的确切比对。
比如科研工作者的脱发现象。当我说我秃了,你不用关心我掉了多少头发,还剩多少头发,你只需要知道我秃了这一情况就可以了
早先,比对(alignment)和匹配(mapping)经常会被误用。但是像Kallisto和Salmon之类的工具改变了这一情况,因为他们将reads assign到基因、功能以及其他的什么东西上,而不需要知道其中确切的比对信息。这样做的方式有两个优点:
- 更快
- 我们通常不关心比对,这在一些应用/工具中是一个很大的优势
Kallisto:一个用于single cell & bulk RNA-seq数据的转录本定量工具
Salmon:与Kallisto类似的一个工具
不同种类的alignment
既然讲到了alignment,那我们就继续看看alignment带上不同的形容词,都有什么不同的含义。
- pairwise alignment:两个序列之间的比对
- Multiple sequence alignment:两个及以上序列之间的比对
- Short read aligners:就是寻常说的pairwise
alignment quality vs. mapping quality
我们都知道比对之后,会有比对的质量,那么mapping和alignment的质量有什么不同呢?作为一个认真努力的科研工作者,那我必须深挖一下这个问题。
- alignment quality:是指reads比对到参考基因组上的匹配质量
- mapping quality:是reads正确匹配到基因组位置的置信度(可能性)
比如,将一个read比对到基因组上,这个read在该基因组上的若干个位置都有很完美的比对。此时alignment quality是很高的,而mapping quality是比较低的。
depth vs. coverage
既然都讲到了比对,那么测序深度和覆盖度就不得不提一下了。
- depth(测序深度):通常是指整个基因组。(测序的reads数 * reads 的长度)/单倍体基因组的长度
- coverage(覆盖度):通常是指某个具体位点的深度。比如:测序过程中,某一个区域(比如,某个基因,某一个碱基位置等)所覆盖的reads数
coverage取决于具体的比对算法。比如:有的算法会在这里刚好匹配,有的认为在这里存在错配,有的则插入一个gap……
正如上面所述,二者应该是有区别的。但是大部分文献都会将其混用,如果没有前后文的对照,你很有可能会误解作者的意思。
那么该怎么办呢?怎么办呢?通常有三个方法:
- 利用前后文语境,猜测此处的含义
- 看到coverage首先把它当作覆盖度,看到depth首先把它当作测序深度
此外,需要注意的一点是,depth/coverage经常会和其他词语联合使用,这个时候就需要靠经验总结了。我知道你们肯定懒得总结,所以我在这里给出了自己总结的的一些小tips
- breadth of coverage(覆盖范围):在给定测序深度的情况下,基因组碱基得覆盖百分比
- Depth of coverage:等同于coverage
- Sequence depth:等同于depth
Reference
- Sequencing depth and coverage: key considerations in genomic analyses
- https://www.biostars.org/p/6571/
- https://bitesizebio.com/34461/ngs-depth-coverage-deep-sequencing/