取两个VCF的差集

参考:https://www.biostars.org/p/113509/#113509
https://samtools.github.io/bcftools/bcftools.html#isec

bcftools isec [option] A.vcf.gz B.vcf.gz […]

创建A和B的交集和补集,将输出保存在 dir/*

bcftools isec -p dir A.vcf.gz B.vcf.gz

过滤存在于A(需要 INFO/MAF>=0.01)和 B(需要 INFO/dbSNP)但不在C 的位点,并创建交集,仅包括过滤后出现在至少两个文件中的位点

bcftools isec -e'MAF<0.01' -i'dbSNP=1' -e- A.vcf.gz B.vcf.gz C.vcf.gz -n +2 -p dir

精确匹配等位基因,从A中提取A和B共有的位点

bcftools isec -p dir -n=2 -w1 A.vcf.gz B.vcf.gz

提取 A 或 B 私有的位点,仅按位置进行比较

bcftools isec -p dir -n-1 -c all A.vcf.gz B.vcf.gz

print存在于 A 和 B 但不存在于 C 和 D 中的列表

bcftools isec -n~1100 -c all A.vcf.gz B.vcf.gz C.vcf.gz D.vcf.gz

提取只存在于A而不存在于其他文件中的position

bcftools isec -C A.vcf.gz B.vcf.gz
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容