1. 背景介绍
edgeR是一个R软件包,也转录组差异表达分析中常用的工具,主要关注的是差异表达基因,甚至可以进行无重复的差异表达分析。它的作用对象是readcount文件,行代表基因,列代表样本,数值代表的是比对到每个基因的reads数目,不能使用rpkm/fpkm/tpm等表达量统计文件进行分析。除了生成差异表达结果文件外,edgeR工具还可以直接绘制火山图,使用更方便。
工具链接:http://www.cloud.biomicroclass.com/CloudPlatform/SoftPage/EDR
2. 操作方法
2.1. 上传文件
需要输入的文件包括基因数据表和分组文件,文件必须为tab-delimited保存的txt格式,基因数据表必须是整数
可以使用凌恩生物转录组结题报告中的readcount数据表,位于结果文件夹中,名为genes.read.txt,每一行代表基因,列代表样本,值代表比对到每个基因的reads数,示例文件如下。
分组文件同样为制表符分隔的txt文本文件,第一列为样本名,第二列为分组名,示例文件如下:
在wps、word等软件中,使用excel输入数据,保存数据时有制表符分隔的txt文本文件和Unicode文本txt两种格式,请选择制表符分隔的txt文本文件
注意:从上至下首先出现的分组为处理组,示例文件中为AvsB(A为处理组,B为对照组)
2.2. 设置参数
同时还需要设置分析的FDR值和FC值阈值,默认以FDR<0.05&|FC|值≥1定义显著差异基因,其中当FC=1时,相当于2倍差异倍数,FC=2时,相当于4倍差异倍数
上传文件并设置阈值后,点击“提交”按键,开始分析
2.3. 查看任务
提交任务后,点击界面右侧的“历史任务”模块,或者点击界面“我的任务”,都可以查看任务编号、软件名称和状态等信息,点击任务编号,即可查看分析结果。
在任务详情界面,展示的是任务参数、结果文件列表和在线调整图片3个区域,提供结果文件下载和在线调整图片功能。
3. 结果文件
结果文件包括差异表达倍数表、差异基因总表、上调基因表、下调基因表和根据差异基因总表绘制的火山图,点击下载列的眼睛图标即可在线查看文件内容。
edger.xls差异表达倍数表(sig列除down和up外,还显示none):
edgeR.select.xls差异基因总表(sig列仅显示up和down的基因):
edgeR.up.xls上调基因表(仅up的基因,sig列只显示up):
edgeR.down.xls下调基因表(仅down的基因,sig列只显示down):
火山图:每个点代表一个基因,其中蓝色的点代表显著下调基因(down),红色的点代表显著上调基因(up),灰色点代表无显著差异基因(none)
4. 在线调整图片
通过数据布局参数、颜色参数和字体参数三个模块在线调整图片。
数据布局参数:重新设置FDR值和FC值阈值、XY轴范围、是否绘制分界线、图片清晰度和尺寸
颜色参数:自定义分界线和数据点颜色(一般文献默认蓝色为下调红色为上调灰色为无显著差异基因,也可以自行调整上下调基因配色)
字体参数:XY轴字体大小、主标题大小、自定义XY轴标题和主标题
注意事项:
在线调整区域参数只能对图片展示效果进行调整,不能调整表格文件