推荐一个 VCF 文件格式转换的脚本。
https://github.com/edgardomortiz/vcf2phylip
常见用法:将 VCF 文件转换为 PHYLIP 格式
python vcf2phylip.py -i input.vcf
-i或--input:指定输入的 VCF 文件。如果 VCF 文件是.vcf.gz格式,它会自动解压并读取。
自定义输出文件夹和文件名前缀:
python vcf2phylip.py -i input.vcf --output-folder ./output --output-prefix mydata
--output-folder:指定输出文件夹名称。如果不存在,将会自动创建。
--output-prefix:自定义输出文件名前缀。默认情况下,输出文件名前缀与输入 VCF 文件名相同。
设置外类群:
python vcf2phylip.py -i input.vcf -o OutgroupSample
-o或--outgroup:指定外类群样本名称。
输出不同格式:
# 生成 FASTA 格式
python vcf2phylip.py -i input.vcf -f
# 生成 NEXUS 格式
python vcf2phylip.py -i input.vcf -n
# 生成 二进制 NEXUS 格式(适用于 SNAPP 分析)
python vcf2phylip.py -i input.vcf -b
-f或--fasta:生成 FASTA 格式。
-n或--nexus:生成 NEXUS 格式。
-b或--nexus-binary:生成二进制 NEXUS 格式,仅适用于二倍体基因型。