vcftools提取指定位点

目的

在已有vcf文件中挑选指定位点,形成新的vcf文件

准备

  1. 指定位点写入文件pos.list,Tab键分隔,注意第一列染色体信息与vcf文件里一致
chr01   26254
chr01   85736
chr01   172959
chr01   174300
chr01   188386
chr01   505332
chr01   721387
chr01   733284
chr01   743023
chr01   743281
  1. vcf文件known.vcf.gz或known.vcf

操作

vcftools --gzvcf known.vcf.gz --positions pos.list --recode --out result    #--gzvcf是针对压缩vcf文件的参数,若处理未压缩vcf文件,此参数换成--vcf即可

举例

从var1.vcf中挑选var2.vcf包含的位点,形成var3.vcf。

#1.awk软件提取var2.vcf包含的位点
awk -F'\t' '{ print $2 "\t" $3 }' var2.vcf > pos2.list
#2.vcftools软件从var1.vcf中提取目标位点形成var3.vcf
vcftools --vcf var1.vcf --positions pos2.list --recode --out var3    #--recode参数生成文件后缀为.recode.vcf
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容