2021-05-25记录一个beagle使用过程中的坑

对816个样品的SNP的VCF进行impute,首先上beagle,遇到了上个贴子说的各种内存不足问题,然后换tassel进行impute依旧不行,中间耗时小一周。

指导选择放弃,直接用plink进行过滤SNP,获得过滤后的vcf,才能直观看到各个样品在各SNP的情况,发现某几个样品确实很多很多的SNP,突发奇想莫非是因为这几个样品导致impute工作量巨大。

所以通过plink 的mind 0.2 参数过滤到极端缺失的样品后,再次尝试beagle进行impute,竟然可以了,又快又好。

所以在impute之前要不先plink一下样品,

以后采取一下步骤:plink (样品)-beagle(impute)-plink(SNP)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容