我在做BreakPoint Motif分析时,提取每个read在参考基因上的比对位置,一开始我认为read的比对位置不可能有比对到染色体的第一个碱基的,因为染色体结构的复杂性,染色体的两端有高度螺旋化的端粒结构,染色体的开始一串基本都是NNNNNNNN。
image-20231108153552957.png
然后发现我错了啊啊啊啊啊:
444f52a891099f059a3c256cfc0df7f.png
看了所有的染色体,好像只有17号染色体的第一个碱基开始都被测序出来了,那它有什么特殊的吗?
简单搜了一下:
ref:https://zhuanlan.zhihu.com/p/635612574
image-20231108154039314.png
ref:https://www.nsfc.gov.cn/publish/portal0/tab440/info59391.htm
image-20231108154203731.png
当然,我用的参考基因组版本为hg19~