几天前,与CJ讨论,要开发用于转录组基因差异表达分析的插件,当时CJ已经有了想法,我想我就放弃吧,CJ说我们支持多人开发,我想想也对,参考CJ的插件,我添加了一些我的想法,既然进行分析,何不满足批量的处理呢?
说干就干,代码都是现成的,但是怎么支持多对数据的处理呢,对于我这个生信代码搬运工来说,还是有难度的,于是请教了密歇根理工大学的Xuewei Cao博士,于是,Batch DEGs Analysis Tools插件诞生了!
废话不说,上干货!插件已经上传到TBtools Plugin Store(插件商店),所有用户选中该插件,点击 Install Selected Plugin即可完成插件安装( Rserver Plugin 需要先安装,总有人问我SupCorrPlot安装了不能运行,你得先安装环境才行啊)。
安装后,其界面如下图:
第一步,输入第一文件,是输入你的read count矩阵文件,格式如下图:第一列代表基因名,第一行代表各样品,这里的样品编号你依据自己的样品编号就可以,因为在第二个地方,我们会给样品进行重新命名。
第二步,输入样品命名和分组文件,第一列对应你的样品总数,示例文件有42个样品,那么在本文件中,Sample编号会到42,即Sample42;第二个,对样品的分组信息,我们看前6项,样品123代表对照,样品456代表一个处理,我们进行如下命名(见表),末尾数字1是表示第一个对比,依次类推,后续编号分别是2,3.。。。。7;有的人说,我样品重复是2个呢,当然可以,你就命名2个就行;有的说2比3可以做吗,当然可以。
第三步,要输入差异对比文件,就是告诉系统,你要比对几组,格式如下,也就是说,你写几组,就输出几组的分析结果,如果在3的地方不输入这个文件,那么系统会自己瞎比较,直到自己玩嗨为止。
第四步,设置你选择差异基因的阈值,系统默认padj小于0.05且Foldchanged的绝对值大于2时,被认定为差异基因,当然你也可以自己重新输入你想要的阈值。
然后,你点击Start,等候结果(首次运行会花费点时间,因为要安装R包),运行时间依赖你的电脑配置,数据越多,运行时间稍微长一点,一般情况下,很快!
输出结果是2个文件(如下),因为利用DESeq2和edgeR二个包进行的计算(感谢这2个R包的开发者),你可以选择你喜欢的结果使用,是不是很人性啊!哈哈,至于结果,我就不打开了,大家用示例文件去跑一下看看,我只能说,Amazing!
我不是码农,我只是代码的搬运工!上次推出SupCorrPlot插件后,反馈很多,所以加微信群的很多,最后群就满了,只能个人邀请进群,手机几乎卡死,所以还是开了一个QQ群772984060,在这里大家可以直接下载插件!也可以对使用问题进行交流,有兴趣的可以加群,请进群后实名,谢谢!