NextPolish2:一种针对HiFi数据组装的基因组碱基矫正算法

image.png

利用二代测序比三代测序碱基质量值更高的特点,对三代数据组装结果进行polish。 但是不能简单根据比对BAM文件来矫正。这里作者把 HiFI数据重新比对回基因组,计算哪些位点可能有错误。抽出潜在错误位点附近的kmer,判断它是否在二代数据kmer中,在保留。否则去除。
基于Reads 的kmer ,计算Reads和Reads之间权重,使用聚类算法聚类(理想情况下,二倍体被聚成两类,代表父本或者母本),判断组装结果是父本还是母本,然后使用父本或者母本的数据进行矫正。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容