可变剪接鉴定软件rMATS的结果文件内容说明

    是的,本篇不讲解软件的安装使用,因为网上的教程已经非常多了。

    但是有关rMATS的输出结果,网上的教程都很少提到,结果应该怎么看?各文件各列代表了什么信息?很多老师或同学们拿到结果后,非常抓狂,因为不清楚文件内容的含义,因为官网上也没有给出详细的结果说明。

    为此,我们在本篇对rMATS的结果内容项作了梳理,解决这个问题,给大家提供一个参考。

    rMATS评估可变剪接,使用注释文件中的外显子(exon)位置信息,并结合测序数据和基因组比对结果计算各外显子的表达状态,推断可能的外显子可变剪接状态。

首先来看可变剪接的5种模式。

    SE,外显子跳跃,指一个外显子从初始转录物上被剪切掉。

    A5SS,可变5’剪接,它们的3’端剪接位点一致但5’端剪接位点不同,产生不同长度的5’端外显子。

    A3SS,可变3’剪接,它们的5’端剪接位点一致但3’端剪接位点不同,产生不同长度的3’端外显子。

    MXE,可变剪接形成两种不同的转录本,两转录本之间相同的外显子称为constitutive exon, 不同的外显子称为inclusive exon,两个inclusive exon不能同时存在同一转录本。

    RI,内含子保留,在一些转录本中内含子不会被剪切掉,保留在最终的转录本中。

SE*

    以该名称开头的文件,记录了基因组中的SE剪接事件。

    文件中,前几列记录了可变剪接事件的位置信息。

    GeneID、geneSymbol,发生可变剪接的基因id和名称。

    chr、strand、exonStart_0base、exonEnd、upstreamES、upstreamEE、downstreamES、downstreamEE,记录了发生可变剪接的位置信息,包含所在染色体、正负链、剪接位点等。在SE模式下,upstreamexon和downstreamexon拼接在一起,skipped exon被剪切掉。

随后的几列,与该剪接事件的可信度有关。

    IJC_SAMPLE,记录了支持skipped exon被保留(外显子包含)的相关reads数,这意味着该外显子在剪接后将出现在最终加工的mRNA转录物中。

    SC_SAMPLE,记录了支持skipped exon被剪切(外显子跳跃)的相关reads数,这意味着该外显子在可变剪接过程中被切除,不出现在最终加工的mRNA转录物中。

    我们可知,如果该剪接事件比较可信,则理论上SC_SAMPLE中的数值应当更大,IJC_SAMPLE中的数值应当较小,否则,没有有效的证据支持可变剪接(skipped exon被剪切,外显子跳跃)的发生。

    如果存在多组,则分别以IJC_SAMPLE_1、IJC_SAMPLE_2等命名,以分别显示各组数据中,支持剪接事件的reads数量。

    如果每组中存在多个重复,则该列的数据中包含多个值,每个值对应一个样本,以逗号分隔。

    当然,除了reads支持数量,还要考虑外显子长度的问题,因为更长的转录本往往对应了更多的reads count值,还需要根据支持reads数量及外显子长度,对有效reads标准化。

    IncFormLen和SkipFormLen分别对应了外显子是否被剪切所产生转录本同工型的有效长度。IncFormLen,外显子包含同种型的有效长度;SkipFormLen,外显子跳跃同工型的有效长度。

    最后几列,即为综合考虑支持剪接事件的reads数量,以及外显子剪接后的长度,所得的统计指标。

    PValue,可变剪接事件的p值,p值越小约可信。

    FDR,校正后的p值,越小越可信,一般取FDR<0.05作为阈值。

    IncLevel,根据剪接事件所产生同工型的有效长度以及支持剪接事件的reads数量计算,结果反映了样本的最终mRNA转录本中平均包含各自外显子的频率的信息。与上述IJC_SAMPLE等类似,如果存在多组,则分别以IncLevel1、IncLevel2等命名。

    IncLevelDifference = IncLevel1 - IncLevel2,结果可反映不同样本组间,可变剪接事件的差异程度。

A5SS*和A3SS*

    以该名称开头的文件,记录了基因组中的A5SS、A3SS剪接事件。

    除了以下位置信息,A5SS、A3SS中有所不同。

    其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。

MXE*

    以该名称开头的文件,记录了基因组中的MXE剪接事件。

    结果文件中,关于MXE剪接事件所涉及的位置信息,如下所示。

    其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。

RI*

    以该名称开头的文件,记录了基因组中的RI剪接事件。

    结果文件中,关于RI剪接事件所涉及的位置信息,如下所示。

其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,080评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,422评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,630评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,554评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,662评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,856评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,014评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,752评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,212评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,541评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,687评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,347评论 4 331
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,973评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,777评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,006评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,406评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,576评论 2 349

推荐阅读更多精彩内容