一、真核生物mRNA的结构:
二、建库方式:
真核生物mRNA含有poly-A尾,因此最常用的富集真核生物mRNA的方法就是采用附着poly-T oligo的磁珠从total RNA 中抓取mRNA。建库示意图如下图所示:
1、提取总RNA:提取总RNA后需要对其进行质量检查,包括纯度、浓度和完整性(RIN)。如果总RNA起始量太低,不能保证有足够的mRNA用于建库。另外RNA容易降解,而采用附着poly-T oligo的磁珠捕获降解后的RNA会产生3'偏好性,因此建议RIN值大于等于7。
2、mRNA捕获:真核生物的成熟mRNA带有poly-A尾,因此可以采用附着poly-T oligo的磁珠从总RNA中捕获mRNA。
3、mRNA片段化:
4、cDNA第一链合成:以mRNA为模板合成cDNA。
5、cDNA第二链合成:以cDNA第一链为模板合成cDNA第二链。
6、双链cDNA末端修复:3'加A,5'修复。
7、加接头:
8、PCR富集mRNA文库。
9、上机测序。
三、生信分析:
1、数据拆分:利用bcl2fastq软件将bcl文件转换成fastq文件。
2、数据预处理:有些测序reads可能包含测序接头、引物序列、低质量碱基、N含量较高,因此通常需要对测序数据进行预处理,去除这些不合格的碱基或reads。常用的软件有fastp,cutadpater以及Trimmonmatic等。
3、质控分析:对预处理后的数据进行质控分析,通常采用fastqc。
4、参考基因组比对:将测序数据与参考基因组进行比对,常用的比对软件有hisat2,tophat2,STAR等。
5、转录本的组装和定量:常用的软件有cufflinks,stringtie等。
6、差异分析:分析不同处理条件下基因或转录本的表达是否有差异,穿能够与的软件有DEseq2,edger,ballgown等。
7、富集分析:对差异基因进行富集分析,统计学原理是基于超几何分布。