差异剪接分析软件rMATS结果文件解读(v4.1.2)

第一次做差异剪接分析,rMATS做完后一头雾水,查阅资料整理了一下结果文件。

  • 我使用的版本是v4.1.2,用conda安装的,软件的安装和使用就不细说了,网上已经有很多帖子,这里只对几种比较重要的结果文件进行解读。说是解读,其实也只是翻译了一下,目的是帮助自己更好理解。

一些重要的区分

JC和JCEC区分

rMATS中,JC是Junction Counts的缩写,表示跨越剪切位点的reads(暂且叫为JC reads)数量,JCEC是Junction Counts和Exon Counts的缩写合并,Exon Counts表示不跨越剪切位点的reads数量,JCEC可以理解为所有比对上的reads(暂且叫为JCEC reads)。他们的关系见下图:

IJC和SJC区分

这里引用一位老哥的帖子https://www.plob.org/article/22921.html,自己做了一些标注

IJC表示外显子包含的reads数目
SJC表示外显子跳跃的reads数目

注意,图中I和S都是外显子,另外外显子包含是我瞎起的名字。

rMATS中的AS分类

  • SE 外显子跳跃
  • A5SS 5'端可变剪切
  • S3SS 3'端可变剪切
  • MXE 外显子选择性跳跃
  • RI 内含子保留

结果文件类型

rMATS生成的文件大致以下几种:

  • [AS_Event].MATS.JC.txt: 只计算Junction Counts(跨越剪切位点的reads)的最终输出结果
  • [AS_Event].MATS.JCEC.txt: 计算了跨越剪切位点的reads和不跨越剪切位点的最终输出结果
  • fromGTF.[AS_Event].txt: 通过GTF文件和RNA鉴定的所有选择性剪接(AS)事件
  • fromGTF.novelJunction.[AS_Event].txt: 考虑了RNA后确定的选择性剪接(AS)事件,不仅仅考虑GTF文件。这个结果只用跨越剪切位点进行计算。
  • fromGTF.novelSpliceSite.[AS_Event].txt: 只用不跨越剪切位点计算的结果。分析时使用参数 --novelSS 才会计算。
  • JC.raw.input.[AS_Event].txt: 跨越剪切位点的reads的AS事件计数
  • JCEC.raw.input.[AS_Event].txt: 所有reads的AS事件计数

[AS_Event].MATS.JC.txt的结果文件

<font size=1>dfjioan</font>

第几列 第几列 第几列 第几列
表头 描述 A3SS.MATS.JC.txt
MXE.MATS.JC.txt
RI.MATS.JC.txt SE.MATS.JC.txt A5SS.MATS.JC.txt
ID AS事件编号 1 1 1 1
GeneID 可变剪接事件所在基因编号 2 2 2 2
geneSymbol 可变剪接事件所在基因名称 3 3 3 3
chr 可变剪接事件所在染色体 4 4 4 4
strand 可变剪接事件所在链的方向 5 5 5 5
longExonStart_0base 较长外显子的起始位点 6
longExonEnd 较长外显子的终止位点 7
shortES 较短外显子的起始位点 8
shortEE 较短外显子的终止位点 9
flankingES 差异外显子附近的外显子的起始位点 10
flankingEE 差异外显子附近的外显子的终止位点 11
exonStart_0base 外显子的起始位点 6
exonEnd 外显子的终止位点 7
1stExonStart_0base 第一个外显子的起始位点 6
1stExonEnd 第一个外显子的终止位点 7
2ndExonStart_0base 第二个外显子的起始位点 8
2ndExonEnd 第二个外显子的终止位点 9
riExonStart_0base 包含内含子的外显子的起始位点 6
riExonEnd 包含内含子的外显子的终止位点 7
upstreamES 上游外显子的起始位点 10 8 8
upstreamEE 上游外显子的终止位点 11 9 9
downstreamES 下游外显子的起始位点 12 10 10
downstreamEE 下游外显子的起始位点 13 11 11
ID 12 14 12 12
IJC_SAMPLE_1 样品1外显子包含(见下面的解释)的reads数目,重复样品用逗号隔开 13 15 13 13
SJC_SAMPLE_1 样品1外显子跳跃的reads数目,重复样品用逗号隔开 14 16 14 14
IJC_SAMPLE_2 样品2外显子包含(见下面的解释)的reads数目,重复样品用逗号隔开 15 17 15 15
SJC_SAMPLE_2 样品2外显子跳跃的reads数目,重复样品用逗号隔开 16 18 16 16
IncFormLen 外显子包含转录本的长度,用于标准化 17 19 17 17
SkipFormLen 外显子跳越转录本的长度,用于标准化 18 20 18 18
PValue 19 21 19 19
FDR 校正后的PValue 20 22 20 20
IncLevel1 样本1的外显子包含的水平。重复样品用逗号分隔。根据标准化计数计算 21 23 21 21
IncLevel2 样本2的外显子包含的水平。重复样品用逗号分隔。根据标准化计数计算 22 24 22 22
IncLevelDifference average(IncLevel1)-average(IncLevel2) 23 25 23 23

</font>

summary.txt文件

这里用以下命令对summary.txt进行了转置,更方便查看

for i in {1..9}; do cut -f $i summary.txt |xargs|sed 's/ /\t/g' ;done

EventType SE A5SS A3SS MXE RI
AS事件类型 外显子跳跃 5'端可变剪切 3'端可变剪切 外显子选择性跳跃 内含子保留
TotalEventsJC
两组样本中)所有跨越剪切位点事件的数量
12548 527 534 1047 888
TotalEventsJCEC
(两组样本中)所有跨越与不跨越剪切位点事件的数量
12818 538 550 1059 915
SignificantEventsJC
(两组样本中)跨越剪切位点事件达到显著水平的数量
1088 98 82 239 212
SigEventsJCSample1HigherInclusion
(与样本2相比,)样本1中跨越剪切位点事件达到显著水平的数量
370 60 45 92 144
SigEventsJCSample2HigherInclusion
(与样本1相比,)样本2中跨越剪切位点事件达到显著水平的数量
718 38 37 147 68
SignificantEventsJCEC
(两组样本中)跨越与不跨越剪切位点事件达到显著水平的数量
1128 106 95 252 238
SigEventsJCECSample1HigherInclusion
(与样本2相比,)样本1中跨越与不跨越剪切位点事件达到显著水平的数量
391 66 52 100 163
SigEventsJCECSample2HigherInclusion
(与样本1相比,)样本2中跨越与不跨越剪切位点事件达到显著水平的数量
737 40 43 152 75

其他文件的表头信息也差不多。

参考资料:

rMATS差异可变剪切分析 | Public Library of Bioinformatics (plob.org)

rmats-turbo/README.md at v4.1.2 · Xinglab/rmats-turbo · GitHub

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容