新生RNA测序数据质量评估——PEPPRO

新生RNA测序(nascent RNA sequencing)是一种针对于全基因组正在进行转录的RNA进行测序的技术,被广泛的应用于绘制全基因组范围内RNA聚合酶位置与状态图谱。nascent RNA sequencing以2008年发表在Science上的一篇文章开始“声名远扬”,而这篇文章所开发的技术正是大家闲杂所熟知的GRO-seq (global run-on sequencing)(Core et al., 2008)。介绍一下GRO-seq技术,简单来说GRO-seq的整个过程可以概括为“转录终止——转录延伸(run-on)——捕获标记RNA——建库测序”


详细来说:首先将细胞放入液氮中强行终止其RNA的转录延伸,然后再将其细胞核取出,放在含有Br-UTP的run-on工作液中进行延伸,然后再利用特殊的beads来富集带有Br-UTP的RNA片段,最后再进行建库测序。整项技术最关键的目的就在于要精确定位RNA聚合酶的位置,所以在run-on工作液中进行转录延伸是非常重要的一步,如果延伸时间太长就会使得实验的resolution降低,所以作者也指出了解决这个问题的两个措施:
(1)降低run-on工作液中的核苷酸浓度,防止过度延伸;
(2)进行run-on之前先用RNA酶将新生的RNA进行降解。
总之,Science这篇文章讲的很清楚,作为顶刊论文其supplementary file是非常详细的,可以供大家进行具体的参考。

通过对nascent RNA sequencing技术的初步了解,我们可以总结该项技术与传统的RNA-seq的两大差别在于:
(1)nascent RNA sequencing关注于转录的过程,而传统的RNA-seq关注于转录的结果;
(2)nascent RNA sequencing中的reads都是without splicing的,而传统的RNA-seq很多reads却是经过了splicing这个过程的。
所以nascent RNA sequencing在下面几个方面具有非常好的应用:
(1)精准检测实时转录状态的基因表达
(2)精确定位基因的转录位置和转录方向
(3)发现新的转录本,包括非编码RNA
(4)鉴定eRNAs分子

好的数据分析结果一定是要有好的数据质量作为支撑,前面针对于GRO-seq的介绍已经让我们感受到了这个技术中可能会影响数据质量的因素之多,所以我们在进行进行分析之前必须首先对其数据质量进行一个评估,为我们的后续分析提供行前参考。

2021年5月15日发表在Genome Biology上的一篇题为“PEPPRO: quality control and processing of nascent RNA profiling data”的研究论文给出了一份很好的解答(Smith et al., 2021)。这篇文章开发出了一个新的质量评估工具PEPPRO,从多个角度对nascent RNA sequencing数据质量进行了评估。

RNA integrity

这个标准主要是对RNA被降解的情况进行了评估,因为RNA一旦被降解就会影响nascent RNA sequencing技术的resolution,一般来说RNA聚合酶复合物能够保护一段20bp左右的RNA不被降解,所以测序得到的长度小于20bp的reads就很有可能是被降解之后的RNA片段了,显然这样的片段越少越好。


RNA integrity

Library complexity

这个标准主要是对nascent RNA sequencing技术中的PCR duplicate进行评估,如果PCR duplicate含量太高,这个数据质量是不好的,换句话说library complexity是不高的。


Library complexity

Run-on efficiency

由于nascent RNA sequencing的实验过程存在非常剧烈的环境理化性质变化,所以对于那些处于pausing region的RNA聚合酶的继续延伸造成了很大的挑战。所以我们需要来评估一下run-on efficiency这个参数,一般来说这个参数比较大会更加符合我们对数据质量的期望。在RNA转录的过程中,gene TSS附近会有很多RNA聚合酶暂时停滞在这里,所以这段区域也被我们定位为pausing region。
PEPPRO针对于这个标准提出了两个评估方法,分别是pausing index和TSS enrichment。


Pausing index
TSS enrichment

检测到更多处于pausing region的reads就意味着我们剧烈的环境理化性质变化没有很大的影响到这些转录“脆弱”区RNA聚合酶的继续转录。

Nascent RNA purity

既然是nascent RNA sequencing,那么我们肯定要减少mature RNA的比例,因为这些经过转录后加工(如剪切)的RNA已经丧失了定位RNA聚合酶的功能了,所以我们需要对这个参数进行评估。对比nascent RNA sequencing和一般的RNA-seq技术的差异,我们可以用以下参数进行评估:


mRNA contamination

Read feature distribution

这个标准和前面很多都有类似之处,在此就不做赘述了,主要还是关注于nascent RNA sequencing和一般的RNA-seq的差异。


Read feature distribution

上面只列出了部分的评估标准,更多的内容还需要大家细读文章。

如何使用PEPPRO(个人感受)

讲实话,这个工具对nascent RNA sequencing数据质量的评估体系构建是一个很好的工作,但它的具体实现是一个比较让人头疼的问题。具体可见PEPPRO和其github源代码
考虑到很多时候大家需要处理很多组的样本,所以PEPPRO使用looper工具来实现批量处理,实际上就是把它的peppro.py这个代码自动重复run了多次。我们在服务器上可以直接通过 peppro.py --help来查看其关键代码的帮助文档,根据自己的需要进行相应参数的设置。我在使用后是存在一些它描述的结果文件我没有输出的情况,所以在使用体验感上是比较难受的。另外它针对reads的计数也存在进一步商榷的地方。如果你也准备用PEPPRO,更多的细节可以在评论区留言,大家一起交流,我们一起把这个工具用好!

Reference:
[1] Core, L.J., Waterfall, J.J., and Lis, J.T. (2008). Nascent RNA Sequencing Reveals Widespread Pausing and Divergent Initiation at Human Promoters. Science 322, 1845-1848.
[2] Smith, J.P., Dutta, A.B., Sathyan, K.M., Guertin, M.J., and Sheffield, N.C. (2021). PEPPRO: quality control and processing of nascent RNA profiling data. Genome Biol 22, 155.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343

推荐阅读更多精彩内容