差异peaks分析是ATAC-seq下游分析中非常重要的一步,可以鉴定出不同样本之间开放程度不同的DARs(Different Accessible Regions),继而可以鉴定出DARs对应的基因。这类分析目前最常用的软件是DiffBind,通过调用DESeq2与EdgeR这类常用的差异表达基因分析包来进行差异peaks分析。但是DiffBind自身绘图的功能不是很灵活,同样需要调用ggplot2来完成绘图,软件说明书里对PCA、MA、Volcano等图也没有提出一些具体的美化方法,成品比较粗糙(图一)。那么有什么方法得到一个美美的火山图呢?
此处我利用DiffBind生成的差异表达peaks,将其修改成RNA-seq差异基因火山图所需的格式,然后利用ggplot2直接绘制,就大功告成了。具体方法如下:
先把DiffBind生成的原始文件去掉染色体号和起始终止位点,然后使用awk添加一列编号,再添加上表头。这里我输出了三个值,依次是fold、p.value和FDR,其实输出前两个值就够用了。准备工作做好了就可以进行绘图了。
火山图代码如下:
生成的火山图如下:
这样一张比较美观的火山图就画好了,基础代码不变的前提下大家根据自己的文件改变里面的元素就可以了。我这种方法是将DiffBind和ggplot2结合到了一起,如果大家还有更简单的方法欢迎分享哦。