SnpHub搭建 | 数据处理中可能出现的问题

1. VCF文件中出现了position顺序不对(未排好序)

使用bcftools sort进行排序

bcftools sort xxx.vcf -Oz -o xxx.sorted.vcf.gz

2. bcftools在写文件时,因为contig未出现在header中而报错

使用bcftools reheader-f参数,将参照基因组fasta的fai索引文件中的contig信息加入vcf的header中。

bcftools reheader -f ref.fasta.fai xxx.vcf.gz  -o xxx.reheadered.vcf.gz

-f参数似乎是较新版本的bcftools才加入的参数,在1.8版本的bcftools上提示无此参数,而1.10版本可以使用。

也可以手动编辑文件头,并将新文件头替换至vcf

bcftools view xxx.vcf.gz -h > header.txt

vi header.txt

bcftools reheader -h header.txt xxx.vcf.gz -o xxx.reheader.vcf.gz
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。