在做生物信息分析时,我们经常会用到滑动窗口统计不同区间内的变异数量,但是对于生物信息初学者(不具备编程能力)存在一定难度,这里有简单便捷实现滑动窗口的方法。
- 通过samtools获取基因组中个条染色体的长度
samtools faidx Brapa.fa
- 通过bedtools生成区域文件
#生成500kb的区域
bedtools makewindows -g Brapa.fai -w 500000 > region.bed
- 输入vcf文件,用bedtools计算每个区域存在的变异个数
bedtools coverage -a region.bed -b aaa.vcf -counts > aaa.vcf_500kb_window.txt