VCF文件的一些处理方法

  1. 根据vcf文件提取样本名
bcftools query -l snp.vcf.gz | awk '{ if (NR <= 40) {sp=substr($1,1,3); print $1} else {print $1;}}' > Sample_name.txt
  1. 使用bcftools concat 合并相同样本不同染色体的vcf
bcftools index Chr1.snp_result.vcf.gz
bcftools index Chr2.snp_result.vcf.gz
bcftools concat *.vcf.final.gz -O z -o all.chr.vcf.gz
bcftools index all.chr.vcf.gz

检查:

#检查合并后vcf的样本名
bcftools query -l all.chr.vcf.gz | awk '{ if (NR <= 40) {sp=substr($1,1,3); print $1} else {print $1;}}' | less
#
bcftools view -c1 Chr1.snp_result.vcf.gz | grep -v -c '^#' 
128309
bcftools view -c1 --regions Chr1 all.chr.vcf.gz | grep -v -c '^#' 
128309

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容