分析时间序列的RNA-seq tool

简介

maSigPro,这是一款可以综合分析时间序列RNA-seq的工具。
这款工具最初由Conesa等人于2006年开发,于2014年经Nueda等人进一步优化而得到的

那么,我们在研究生物学问题的时候,往往是一个动态的过程,即某些基因的表达水平随着时间的推移厄尔发生动态改变
而传统的DEG往往只能比较treatment和control,却忽略了时间带来的效应。而maSigPro综合考虑了每一时期的treatment与control的区别,而且也考虑了不同时间点基因表达的动态变化

其工作流程为:


原理

第一次回归

maSigPro采用的是广义线性模型进行建模,即下列式子:



结合该式子来看,相比较于普通的DEG来说,在该广义线性加入了关于时间的项和回归系数

其中:

  1. i = 实验组别
  2. j = 时间点
  3. J=多项式回归的最高次数,与你的时间点数量有关
  4. r=重复(生物学重复)
  5. D=虚拟二进制变量(实验条件,D1,D2,D3... 为不同的实验处理/条件),即有某处理为1,没有为0
  6. T=时间点
  7. yijr=标准化后的表达值
  8. β,δ,γ,λ=回归系数
  9. β0,δ0,γ0,λ0 为对照组中的回归系数;βi,δi,γi,λi表
    示第 i +1 组与对照组之间的差异,对于时间变量而言通常 i = 1
    为对照组

其中D为:



比方说 i = 1 这组是没有任何处理的.所以所有的实验处理都为0 ; i = 2 这组经过了D1的处理, 所以D1 这项为 1

如果考虑不同组别的差异:
那么上式子中的β0,δ0,γ0,...,λ0为对照组的回归系数,βi,δi,γi,λi表示第 i + 1组与对照组之间的差异,通常 i = 1 为对照组
那么当 i = 1 时:



当 i = 2 时, (D1 = 1):



对于 i = 2 的基因表达量 y2jr 来说,它的系数是β0 + β1, δ0 + δ1, γ0 + γ1.....(后面不再列举了)这样的和形式,那么根据前面所说的β0, δ0 , γ0 ...... 是对照组的回归系数,β0 + β1 , δ0 + δ1 , γ0 + γ1 ......是其中一个treatment(DI)的回归系数,那么β1 , δ1 , γ1 就代表了该treatment与对照之间的差异,那么 i = 3,4..... 也是同样的道理,其系数的加和表示与对照组的差异

其中时间T矩阵是自己定义的,这里举两个次项的例子,往后的以此类推

1.当考虑线性回归建模(最高一次项)时

依次看不同时间点与不同处理的变化:
当 j = 0 时
i = 1 , j = 0:


i = 2 , j = 0:

i = 3 , j = 0:

当 j = 1 时
i = 1 , j = 1:


i = 2 , j = 1:

i = 3 , j = 1:

当 j = 2 时
i = 1 , j = 2:


i = 2 , j = 2:

i = 3 , j = 2:

2.当考虑二次回归建模(最高二次项)时

依次看不同时间点与不同处理的变化:
当 j = 0 时
i = 1 , j = 0:


i = 2 , j = 0:

i = 3 , j = 0:

当 j = 1 时
i = 1 , j = 1:

i = 2 , j = 1:

i = 3 , j = 1:

当 j = 2 时
i = 1 , j = 2:


i = 2 , j = 2:

i = 3 , j = 2:

而设置多项式的最高次数我们通过degree来设置:

design <- make.design.matrix(condition,degree = 6)
#the degree of the regression fit polynome. degree = 1 returns linear regression, degree = 2 returns quadratic regression, etc

对于degree的设置,很大程度上依赖于你时间点的个数,时间点个数越多,degree也就设置的越高,一般就设置为你时间点的个数比较好

仍然考虑两个组别,两个时间点的情况,即 i = 1组和 i = 2组分布在 j = 1 这个时间点上和 j = 2这个时间点上的情况,其中D1表示实验组处理,T1为第一个时间点,T2为第二个时间点;i ≤ I - 1(I 为 组数),j ≤ J - 1(J 为时间点数)
对应 D 矩阵有
对于对照组的第一个时间点(i = 1,j = 1) :

对于对照组第二个时间点(i = 1,j = 2):

对于实验组的第一个时间点(i = 2,j = 1):

对于实验组的第二个时间点(i = 2,j = 2):

(1). 相同时间点,不同组别的差异为:y21r - y11r 或者 y22r - y12r
(2). 相同组别,不同时间点的差异为:y12r - y11r 或者 y22r - y21r

那么依次求解参数即可

所以第一次回归的目的是建立基因表达量,对照与treatment,以及时间之间的关系式

第二次回归

这次回归属于逐步回归,即将不显著的回归系数项剔除,这一步目前有两大算法,向前算法和向后算法,其目的都是保留统计学显著的系数项

结果


该软件结果可以根据基因表达模式进行分类,然后就可以看到随时间,基因表达的动态变化了

另外,该软件是可以将动态变化的基因分cluster的,比方说上图就分了3个cluster,那么这些cluster是根据基因的表达模式区分的,这样以来,就可以细化到每个cluster随时间的变化趋势,从而找出自己感兴趣的cluster

参考:
传送门

《Comparative analysis of differential gene expression tools for RNA sequencing time course data》
https://academic.oup.com/bib/article/20/1/288/4364840

《Next maSigPro: updating maSigPro bioconductor package for RNA-seq time series》
https://academic.oup.com/bioinformatics/article/30/18/2598/2475510

《maSigPro: a method to identify significantly differential expression profiles in time-course microarray experiments》
https://academic.oup.com/bioinformatics/article/22/9/1096/200371#e1

maSigPro说明文档:
http://www.bioconductor.org/packages/release/bioc/vignettes/maSigPro/inst/doc/maSigProUsersGuide.pdf

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,198评论 6 514
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,334评论 3 398
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,643评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,495评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,502评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,156评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,743评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,659评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,200评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,282评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,424评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,107评论 5 349
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,789评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,264评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,390评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,798评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,435评论 2 359