前提:
群体callsnp的时候是按个体来生成gvcf的,按染色体来合并gvcf更为快捷
cat chr|while read id;
do echo "
gatk --java-options -Xmx40g CombineGVCFs -R ref.fa --variant GVCF.list -L ${id} -O ./VCF/${id}.g.vcf.gz"
>> concise.sh
然后合并
gatk --java-options "-Xmx20g" CombineGVCFs -R ref.fa --variant gvcf_1.list -O combine.g.vcf.gz
推荐可以使用一些并行的软件,大大加快call snp速度