是的,本篇不讲解软件的安装使用,因为网上的教程已经非常多了。
但是有关rMATS的输出结果,网上的教程都很少提到,结果应该怎么看?各文件各列代表了什么信息?很多老师或同学们拿到结果后,非常抓狂,因为不清楚文件内容的含义,因为官网上也没有给出详细的结果说明。
为此,我们在本篇对rMATS的结果内容项作了梳理,解决这个问题,给大家提供一个参考。
rMATS评估可变剪接,使用注释文件中的外显子(exon)位置信息,并结合测序数据和基因组比对结果计算各外显子的表达状态,推断可能的外显子可变剪接状态。
首先来看可变剪接的5种模式。
SE,外显子跳跃,指一个外显子从初始转录物上被剪切掉。
A5SS,可变5’剪接,它们的3’端剪接位点一致但5’端剪接位点不同,产生不同长度的5’端外显子。
A3SS,可变3’剪接,它们的5’端剪接位点一致但3’端剪接位点不同,产生不同长度的3’端外显子。
MXE,可变剪接形成两种不同的转录本,两转录本之间相同的外显子称为constitutive exon, 不同的外显子称为inclusive exon,两个inclusive exon不能同时存在同一转录本。
RI,内含子保留,在一些转录本中内含子不会被剪切掉,保留在最终的转录本中。
SE*
以该名称开头的文件,记录了基因组中的SE剪接事件。
文件中,前几列记录了可变剪接事件的位置信息。
GeneID、geneSymbol,发生可变剪接的基因id和名称。
chr、strand、exonStart_0base、exonEnd、upstreamES、upstreamEE、downstreamES、downstreamEE,记录了发生可变剪接的位置信息,包含所在染色体、正负链、剪接位点等。在SE模式下,upstreamexon和downstreamexon拼接在一起,skipped exon被剪切掉。
随后的几列,与该剪接事件的可信度有关。
IJC_SAMPLE,记录了支持skipped exon被保留(外显子包含)的相关reads数,这意味着该外显子在剪接后将出现在最终加工的mRNA转录物中。
SC_SAMPLE,记录了支持skipped exon被剪切(外显子跳跃)的相关reads数,这意味着该外显子在可变剪接过程中被切除,不出现在最终加工的mRNA转录物中。
我们可知,如果该剪接事件比较可信,则理论上SC_SAMPLE中的数值应当更大,IJC_SAMPLE中的数值应当较小,否则,没有有效的证据支持可变剪接(skipped exon被剪切,外显子跳跃)的发生。
如果存在多组,则分别以IJC_SAMPLE_1、IJC_SAMPLE_2等命名,以分别显示各组数据中,支持剪接事件的reads数量。
如果每组中存在多个重复,则该列的数据中包含多个值,每个值对应一个样本,以逗号分隔。
当然,除了reads支持数量,还要考虑外显子长度的问题,因为更长的转录本往往对应了更多的reads count值,还需要根据支持reads数量及外显子长度,对有效reads标准化。
IncFormLen和SkipFormLen分别对应了外显子是否被剪切所产生转录本同工型的有效长度。IncFormLen,外显子包含同种型的有效长度;SkipFormLen,外显子跳跃同工型的有效长度。
最后几列,即为综合考虑支持剪接事件的reads数量,以及外显子剪接后的长度,所得的统计指标。
PValue,可变剪接事件的p值,p值越小约可信。
FDR,校正后的p值,越小越可信,一般取FDR<0.05作为阈值。
IncLevel,根据剪接事件所产生同工型的有效长度以及支持剪接事件的reads数量计算,结果反映了样本的最终mRNA转录本中平均包含各自外显子的频率的信息。与上述IJC_SAMPLE等类似,如果存在多组,则分别以IncLevel1、IncLevel2等命名。
IncLevelDifference = IncLevel1 - IncLevel2,结果可反映不同样本组间,可变剪接事件的差异程度。
A5SS*和A3SS*
以该名称开头的文件,记录了基因组中的A5SS、A3SS剪接事件。
除了以下位置信息,A5SS、A3SS中有所不同。
其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。
MXE*
以该名称开头的文件,记录了基因组中的MXE剪接事件。
结果文件中,关于MXE剪接事件所涉及的位置信息,如下所示。
其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。
RI*
以该名称开头的文件,记录了基因组中的RI剪接事件。
结果文件中,关于RI剪接事件所涉及的位置信息,如下所示。
其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。