注:如何想看WES正常流程建议查看”wes流程.md“
1.分lane测序的数据是先合并再比对,还是先比对再合并?
-
先说结论:在WES和WG中,应该先比对fq生成bam后,质控后,再合并为完整的bam文件
原因:1 假如有4个lane生成相应的fq文件,其中3个生成bam后质控发现质量很好,1个质量差,比对后合并可以单独处理该质量差的数据。
2 处理速度问题:比对4个小文件快于比对1个大文件。
- 67例患者处理的shell脚本,主要工具是samtools merge
#!/bin/bash
bam=/public/home/lichunhong/shenheng/wes/Result_X101FY19010492-Z03-J006_B10_first_20201014/bam
bam_merge=/public/home/lichunhong/shenheng/wes/Result_X101FY19010492-Z03-J006_B10_first_20201014/bam_merge
cd $bam_merge
cat name4.txt|while read id
do
i=($id)
samtools merge ${i[0]}.bam ${i[1]} ${i[2]} ${i[3]}
done
###name4.txt与下面name.3txt结构类似
#!/bin/bash
bam=/public/home/lichunhong/shenheng/wes/Result_X101FY19010492-Z03-J006_B10_first_20201014/bam
bam_merge=/public/home/lichunhong/shenheng/wes/Result_X101FY19010492-Z03-J006_B10_first_20201014/bam_merge
cd $bam_merge
cat name3.txt|while read id
do
i=($id)
samtools merge ${i[0]}.bam ${i[1]} ${i[2]}
done
##nmae3.txt内容为bam文件存贮位置和相应的代码
ZYS_2_FKDO202257150-1A_HKKHFDSXY ZYS_2_FKDO202257150-1A_HKKHFDSXY_L4_1.bam ZYS_2_FKDO202257150-1A_HKKYHDSXY_L4_1.bam
- !!! 一定要查看合并后bam文件header information 是否一致,是否正确,不然后续工作十分麻烦!
我的处理未出现相应问题
这里贴出来了一个处理案例的连接