在RNA-Seq的分析中,对基因或转录本的read counts数目进行标准化(normalization)是一个极其重要的步骤,因为落在一个基因区域内的read counts数目取决于基因长度和测序深度。很容易理解,一个基因越长,测序深度越高,落在其内部的read counts数目就会相对越多。当我们进行基因差异表达的分析时,往往是在多个样本中比较不同基因的表达量,如果不进行数据标准化,比较结果是没有意义的。因此,我们需要标准化的两个关键因素就是基因长度和测序深度,常常用RPKM (Reads Per Kilobase Million), FPKM (Fragments Per Kilobase Million) 和 TPM (Transcripts Per Million)作为标准化数值。那么,这三者计算原理是什么,有何区别呢?
为了更清楚的展示计算过程,我们用三个样本的4个基因的read counts矩阵做例子(来源于YouTube)。如表1:
RNA-Seq分析|RPKM, FPKM, TPM, 傻傻分不清楚?
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 一篇RNA-seq分析流程的综述,全面而详细!深度好文,可用来反复阅读。初学者用于把握RNA-seq真个流程及各个...
- 知识的学习没有一蹴而就,没有捷近,扎实的学习是唯一的捷近。 一篇RNA-seq分析流程的综述,全面而详细!深度好文...
- 在高通量测序当中,很重要的一块就是检测基因的表达量,它是差异分析和转录组数据分析的基础。与q-PCR相似,基因表达...