nanopore测序数据

nanopore技术的错误率具有偏好性,包含indel、单碱基错配等错误类型,且存在系统误差。在高GC含量区域、同聚物区域和串联重复区域错误率大大增加。

同聚物Homopolymer是指基因组上单一碱基重复的区域(例 AAAAAAAAAA),这样的区域基因组上还不少,会引入indel。

串联重复序列是指以相对恒定的短序列为重复单位,首尾相接, 串联连接形成的重复序列,又称卫星DNA (satellite DNA)。在人类基因组中,串联重复序列约占10%,主要分布在非编码区, 少数位于编码区。编码区中的串联重复序列与功能有关,非编码区串联重复序列多分布在间隔DNA或内含子,重复单位短的仅2bp长的可达数十碱基对,重复次数少则数次,多则几百次,会引入indel。

缺失型错误率和错配错误率在高GC区域出现了显著的增加,呈现明显的GC bias现象

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一开门,迎面扑来的花香,亮堂得房间,平整的被子,很温馨很家,感谢阿姨的辛苦付出 忏悔过去只是看不干净的地方,而嘴上...
    施雅方阅读 81评论 0 0
  • 记得刚学完线下课就听过南子老师的思维导图与绘本分享,当时觉得安的种子这本书非常唯美,就买了一本来看,每次有空的时候...
    土豆天赋能量咨询师阅读 1,259评论 0 8
  • 今天还在睡梦里,就被励之哥吵醒,他说要去隔壁的村落看有没有喜欢的食材,然后买回来做几道硬菜,就留下我来看店,最近正...
    rise_esir阅读 441评论 0 0
  • 要想让她开心,首先要了解她,关注对方喜欢的食物,并记录下来,比如了解她喜欢看哪种类型的书,然后每个月买一本书送给她...
    银剑小王子阅读 606评论 2 2