前一篇推送解读了2022年发表在DC上的关于拟南芥再生的文章。文章种利用TOBIAS鉴定了转录因子的活性。本次推送将介绍这款软件的原理及使用。
TOBIAS——2020NC
近几年,用ATAC-seq来检测转录因子足迹的软件逐渐完善,2020年发在NC上的这款软件——TOBIAS,可以利用ATAC-seq的比对数据bam文件以及基因组的注释信息去计算全基因组哪些位置有这种转录因子足迹。
图中深蓝色标记的这一段就是会被识别的转录因子足迹。如果我们输入了转录因子的motif矩阵,该软件会帮我们预测出这个位置出现的是哪一种转录因子。特别是在模式生物拟南芥中,各个转录因子被研究的很清楚,所以在拟南芥中的预测效果非常好。
软件安装
该软件的依赖较为复杂,所以建议通过上述操作在新的环境中完成配置。
选项介绍
该软件一共内置了10个子选线以实现不同的功能。对于常规的ATAC-seq数据鉴定转录因子活性只用前三个选项即可完成。
1-ATACorrect
ATAC-seq测序中用到的Tn5转座酶具有明显的的插入偏见,这干扰了足迹分析,因此应该进行校正。ATACorrect选项用来实现这种校正。
输入文件包括该样本ATAC-seq的bam文件,基因组序列文件、该样本ATAC-seq 鉴定到的peak的bed文件(可查看往期推送,通过MACS2完成)。
--cores指定线程数, --outdir指定输出路径。
输出文件的{prefix}_corrected.bw 是校正后的结果,用于后续鉴定TF活性。
2-ScoreBigwig
这一步主要用于鉴定转录因子足迹区域。
输入上一步校正后的bw文件,peak的bed文件,输出鉴定到的转录因子足迹,注意输出的是bw文件而非bed文件。
3-BINDetect
根据上一步得到的转录因子足迹位点,再结合转录因子的结合motif可以得到每一种转录因子的活性。
转录因子结合motif可以从Plant Transcription Factor Database下载,注意最好整合成一个文件。
输入文件指定从Plant Transcription Factor Database下载的转录因子结合motif的meme文件、第二步得到的转录因子足迹bw文件、基因组序列文件、test和test2的peak 合并后的bed文件。
作者提到这一步可以应用到3种不同的场景:
1、对单个条件鉴定TF活性
2、对两个条件鉴定TF活性,可以进行差异分析
3、对时间序列数据鉴定TF活性
具体可参考https://github.com/loosolab/TOBIAS/wiki/BINDetect
主要的输出文件如图。<outdir>/bindetect_results.{txt,xlsx}文件提供了每一种TF的得分。