目的
在已有vcf文件中挑选指定位点,形成新的vcf文件
准备
- 指定位点写入文件pos.list,Tab键分隔,注意第一列染色体信息与vcf文件里一致
chr01 26254
chr01 85736
chr01 172959
chr01 174300
chr01 188386
chr01 505332
chr01 721387
chr01 733284
chr01 743023
chr01 743281
- vcf文件known.vcf.gz或known.vcf
操作
vcftools --gzvcf known.vcf.gz --positions pos.list --recode --out result #--gzvcf是针对压缩vcf文件的参数,若处理未压缩vcf文件,此参数换成--vcf即可
举例
从var1.vcf中挑选var2.vcf包含的位点,形成var3.vcf。
#1.awk软件提取var2.vcf包含的位点
awk -F'\t' '{ print $2 "\t" $3 }' var2.vcf > pos2.list
#2.vcftools软件从var1.vcf中提取目标位点形成var3.vcf
vcftools --vcf var1.vcf --positions pos2.list --recode --out var3 #--recode参数生成文件后缀为.recode.vcf