根据染色体提取vcf中的信息:
bcftools view -r chr20,chr21,chr22 NA12878.vcf.gz -o NA12878.vcf.chr20_22.gz -O z
解释:
提取金标准变异NA12878.vcf.gz中20、21和22染色体的变异,保存到NA12878.vcf.chr20_22.gz文件中
-O z:表示使用压缩形式保存文件
提取之后的文件作为其它软件输入时经常需要索引,可按如下建立索引:
bcftools index -t NA12878.vcf.chr20_22.gz
解释:
-t:产生TBI格式的索引(如果没有-t选项,默认会产生csi的索引)
命令结束后会产生NA12878.vcf.chr20_22.gz.tbi的索引文件
————————————————
版权声明:本文为CSDN博主「bigcindy」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Jwenxue/article/details/109330562