NextPolish2：一种针对HiFi数据组装的基因组碱基矫正算法

image.png

利用二代测序比三代测序碱基质量值更高的特点，对三代数据组装结果进行polish。但是不能简单根据比对BAM文件来矫正。这里作者把 HiFI数据重新比对回基因组，计算哪些位点可能有错误。抽出潜在错误位点附近的kmer，判断它是否在二代数据kmer中，在保留。否则去除。
基于Reads 的kmer ,计算Reads和Reads之间权重，使用聚类算法聚类（理想情况下，二倍体被聚成两类，代表父本或者母本),判断组装结果是父本还是母本，然后使用父本或者母本的数据进行矫正。

最后编辑于：2024.04.14 17:35:30

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

2赞3赞

赞赏

手机看全文

NextPolish2：一种针对HiFi数据组装的基因组碱基矫正算法

相关阅读更多精彩内容

友情链接更多精彩内容