flanking sequence for candidate SNPs

  1. 得到了cadidate SNPs list

Scaffold861: 64225
Scaffold44:1265163
Scaffold121: 842037
Scaffold225: 196363
Scaffold266: 463359
Scaffold68: 899972
...

  1. 获取vcf文件
file=338cand.snps
sed -i 's/\t/:/g' $file
sed -i 's/ /:/g' $file
sed -i 's/:::/:/g' $file
sed -i 's/::/:/g' $file
sed -i 's/:/\t/g' $file
zgrep -F -f  $file gatk4.SNP_VF_SV.vcf.gz > 338cands_no_header.vcf
bcftools view -h gatk4.SNP_VF_SV.vcf.gz > header
cat header 338cands_no_header.vcf > 338cands.vcf

bcftools view -H 338cands.vcf|wc -l
grep -v "#" 338cands.vcf|grep Scaffold|wc -l

检查数目是否一致

SNP注释

DIR=/home/mmcui/poolseq/gatk_hard_filtering/howto_filter
VCF=338cands
java -Xmx4g -jar  ~/annotation/snpEff/snpEff.jar -v Agla_Btl03082013 $DIR/$VCF.vcf > $VCF.ann.vcf
上下游1000bp序列.png

Scaffold1:1235332-1237332
Scaffold1:4378505-4380505
Scaffold1:4078202-4080202
Scaffold1:1639666-1641666
Scaffold1:1555820-1557820

retrieve flanking region

while read line
do 
samtools faidx 210Scaffolds.fasta $line >>flanking_sequences.snps
done < 337snps.positions
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、简介 Samtools是一个用于操作sam和bam格式文件的应用程序集合,具有众多的功能。 它从SAM(序列比...
    Davey1220阅读 21,256评论 2 33
  • Part 3 Samtools view view命令的主要功能是:将sam文件转换成bam文件;然后对bam文件...
    _linun_阅读 441评论 0 2
  • samtools的说明文档:http://samtools.sourceforge.net/samtools.sh...
    YX_Andrew阅读 532评论 0 2
  • samtools的说明文档:http://samtools.sourceforge.net/samtools.sh...
    晓佥阅读 13,471评论 0 6
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,605评论 28 53