ATAC-seq作为检测基因组开放位置的重要手段,被越来越多的使用。而其call peak的方法也有很多,这里我们介绍的是MACS。
MACS最初被发表是用于ChIP-seq call peak,但其简洁的算法受到了人们的认可,在ATAC领域也有很多的应用。
MACS用于ATAC的主流代码如下
macs2 callpeak -t $shuf_atacshift -n ${atacname} --outdir $peakdir --call-summits --SPMR -B -f BAM -g hs --nomodel --shift -100 --extsize 200 --keep-dup all
下面介绍主要参数的含义
--nomodel --shift -100 --extsize 200 #我们不需要shift的model,因为这是ATAC,我们关注的是Tn5剪切的位置,而这就是测序的N端,所以我们把所有的reads都统一成200bp长,并且移动了100bp,这样就保证了这200bp的中心是酶切位点。然后我们堆出来的bedgraph文件其实显示的就是酶切的频率,也就是染色质的开放程度。至于为什么是200bp,这样堆出来的形状更好看吧。
-f BAM #现在双端测序,如果用bam的话,会默认使用单端测序的方法,如果使用双端格式bampe的画需要其他的代码。
--SPMR -B #you can ask MACS2 callpeak to generate pileup per million basepairs for you with --SPMR by downscaling。类似于TPM,是在生成bedgraph时用的,归一化。
--keep-dup all #要不要去重看你之前的处理,如果前面已经去过可以不用去重。