本次主要来理解一下什么是链特异性文库,为什么要构建这种文库。
首先要明确几个概念,对理解后面的讲解很有帮助:
基本概念
正链(forward strand):
我们可以理解为拿到基因组,从左向右读过去,这条链就是正链。
反链(reverse strand) :
反链就是与正链互补的链,因为DNA是双螺旋结果,有正链,就会有反链。
正义链(sense strand):
正义链也叫编码链,正义链的序列与mRNA 的序列一样,即携带蛋白的编码信息的这一条链。
反义链(antisense strand):
与正义链互补的链就是反义链,也叫模板链,其序列与mRNA 互补。
在这个网站学习这些概念不错 概念
通过上面这张图,我们可以区分第一组概念。
我是这样理解的,一个基因的编码序列即是我们所说的正义链,而正义链可能出现在正链上,也可能出现在反链上。
总之这些概念在之后的学习中,还是要反复地巩固,特别是有些时候翻译成中文以后,我们比较容易辨错。
RNA文库制备的区别
公司的销售和我说,做lncRNA一般他们建议做链特异性文库,我查了一下,是链特异性文库可以记录转录本来自正链还是反链。 一般其实到这里我觉得记住就可以了,但是我觉得还是有必要进一步了解一下建库的原理,在网上搜了一下,信息还是蛮多的,主要就是要和公司确认用的文库制备方式是哪一种,比如按照illumina protocol, 做出来的方向就是reverse的方向。下面通过一张图来理解一下
最开始的步骤都一样:
搜集RNA,接着去除rRNA, 把RNA打成片段,然后就是不同的建库方法
左边的图
看最左边的普通RNA建库方式:
1.首先把RNA逆转录成 cDNA, 图中的RT指的是reverse transcript 即反转录酶
2.制备完的文库,是双链cDNA, 在cDNA的两端,会加上两个对称的Y型接头,这种情况下,测得结果,我们无法确定是来自正链还是反链。
中间的图
中间这幅图多展示的是用dUTP做链特异性文库:
1.使用随机引物合成RNA对应的一条cDNA链
2.接着合成cDNA的第二条链,此时采用 dUTP取代dTTP。
3.之后在两端加上接头。
4.再用USER酶处理,将含有U的cDNA链去除,此时,文库中存在的只有一条反链。
5.剩下反链两端的接头是不一样的。
6.下一步通过PCR 扩增,扩增出来的文库,保持了模板上的两个不对称的接头序列。
7.上机测序。
8.测序的过程中是可以分辨正链和反链的。
在做reads比对的时候,如果是正链reads比对到基因方向,那这个read是正义链reads,
如果是正链reads比对到基因反方向,那这个reads 就是反义链reads。
右边的图
右边的图我觉得直接看比较利于理解
陈巍学基因-RiboZero和方向性RNA文库
这个视频讲的比较详细
他的一系列视频都很不错,每个小视频都是一个知识点,在家休息的可以多看看
建库的意义
那这样建库的意义是什么呢,这就和lncRNA 的特点有关了,有关lncRNA可以写很多的笔记,这里着重记录几个作为介绍:
- 如果不能区分reads来自哪一条链,那么NAT lncRNA 与mRMA就区分不出来了
- 从思考问题的熊的博客
中,可知道如果把链特异性文库当做普通的文库来计算,对某一个基因来说影响不大,因为反义链的表达水平相对较低,但是如果是普通建库当做链特异性建库处理,结果误差会比较大。所以说,如果在非普通情况下,不用链特异性文库,我们得到的基因表达量是有问题的。 - 通过这种文库方式,可以挖掘顺式天然反义转录本
还有很多的好处,这里不一一列举
流程总结
其实如果放到公司里面,就是很简单的一个流程图
最后
在搜集信息的路上,发现很多点我已经都没搞明白,都是稀里糊涂地学习,比如IGV的使用,这里发现了一个介绍视频不错,IGV
) 用得好,可以节省不少分析时间。
师兄给了我200M的lncRNA学习资料,我先学习去了