使用GATK进行全基因组数据分析后获得vcf文件,对不同品种变异数据进行特异共有变异位点数据提取

使用GATK进行全基因组数据分析后获得vcf文件,对不同品种变异数据进行特异共有变异位点数据提取

使用工具 BCFtools

bcftools的安装

mamba creat -n bcftools -c bioconda bcftools

激活环境

conda activate bcftools

使用bcftools压缩vcf文件;如不压缩将会报错 not compressed with bgzip

bcftools view file.vcf -Oz -o file.vcf.gz

创建索引

bcftools index file.vcf.gz

提取材料A中特异位点

bcftools isec -C A.vcf.gz B.vcf.gz C.vcf.gz D.vcf.gz  -Oz -o A.unique.vcf.gz

参数含义 -C,--complement 输出只存在第一个文件中但在其他们中不存在的变异位点

-O 输出类型 z 输出vcf压缩格式 -o 输出文件名



今天休息一天没去实验室在寝室远程,太卡不写了明天继续

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容