RNA-seq方法和应用

视频来源:https://www.youtube.com/watch?v=WVKlRlCpSjA

RNA sequencing RNA高通量测序技术:了解各种比较条件下,所有基因表达情况的差异

如:正常组织与肿瘤组织、药物治疗前后表达差异、不同发育阶段不同组织之前的差异


最常用:所有mRNA表达量的差异、mRNA可变剪接的差异、融合基因、SNP


RNA-seq测序方法

1. 去除核糖体RNA(rRNA,占抽提总RNA的绝大部分,95%占人体),mRNA只占2-3%,剩下的是ncRNA

-rRNA在人类中很保守,在各组织之间表达量很稳定,测rRNA的意义不大,一般测mRNA



-illumina Truseq RNA 建库方法:

mRNA测序建库过程图

(1)利用带poly(T)探针的磁珠与总RNA进行杂交,吸附其中带poly(A)尾巴的mRNA(高等生物的mRNA都有Poly(A)尾巴),回收磁珠,并把polyA尾巴的mRNA洗下来

(2)将洗脱下来的mRNA用镁离子(Mg2+)溶液进行处理,把mRNA打断

(3)将打断的mRNA片段用随机引物进行逆转录

(4)逆转录合成第一链cDNA后,再合成出第二链cDNA——成为双链cDNA

(5)在双链DNA两端加A碱基,并接上“Y”型的接头,经过PCR扩增,便成为了可以进行分析的mRNA文库

(6)在Hiseq测序仪上进行测序


做 Truseq RNA-seq文库起始总RNA质量要求

1. 在mRNA的大部分片段是完整的状态下,才能有比较好的建库效果

(若mRNA发生降解,磁珠会吸附靠近3‘端的那些断片(而非完整的mRNA))


降解后的mRNA所产生的不同效果

会洗脱掉一部分的mRNA数据,影响后期的数据分析工作(不准确)


2. 建议在建立文库前进行一次总质检Bioanalyzer

Bioanalyzer 检测18S 28S的电泳峰

Bioanalyzer 检测18S 28S的电泳峰是否高、尖,来判断RNA的质量——越高越尖,代表降解越少,完整度越高

RNA integrity number(RIN值) 最高十分,最低零分,代表RNA完整度的象征(8.0以上比较好建库)


RNA seq的生物信息学分析

1. 将测到的mRNA片段 mapping(比对)到基因组上(看5'端与3'端片段的数量,也可以判断降解的情况)

RNA 表达量差异分析

1.  表达量差异相对定量值:Read per kilobase of exon model per million mapped reads(RPKM值)

——每一百万条可以比对到基因组上的read当中,有几条是可以比对到某个特定基因的,此数值再除以外显子的长度,得到的最终比值

RPKM的计算公式与定义

RPKM含义:某个基因,所表达的mRNA片段与所有被测到的可以Mapping(比对)到基因组上的片段进行比较,因为建库当中mRNA被镁离子溶液打断过,所以要再除以一次外显子的长度(外显子越长越容易被测到,进行一次修正)



RNA表达差异火山图

1. 两个样本RNA的表达量的对比

2. 横轴: 某个基因的表达量是上升,还是下降了     纵轴:这种差异的置信程度     每一个点:同一个基因的mRNA表达量的变化

3. 超过蓝色部分的置信程度很高,可以相信(红色部分)

火山图

RNA表达聚类分析:

1. 横轴样本,纵轴基因(样本会根据亲缘进行分类,建树,每个群体内部有相似的表达特征)

聚类分析图


Gene ontology 分析(GO分析)

1.  国际化的 基因功能分类体系 ——一整套动态更新的标准词汇、严格定义的概念——全面概括任何生物中基因、基因产物的属性

主要描述基因的三个属性:

1. 此基因参与的生物过程

2. 此基因的产物的功能

3. 基因产物在细胞器中的空间定位

差异基因GO富集柱状图(生物过程、分子功能、细胞组分)


有向无环图 基因的功能越往下越精准


通路分析(Kyoto encyclopaedia of genes and genomes,KEGG):公认、权威的基因功能数据库

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容