很长一段时间里发现一个问题,在平常的实验过程中,有一些童鞋还是会对生物学重复和技术重复有一些混淆,今天我们彻底再重温一下。
1、怎么区分生物学重复与技术重复
生物学重复:通俗讲就是指样本重复,比如3只小鼠,同时做一种处理,就是三个生物学重复。
技术重复:通俗讲就是操作重复,简单理解一般就是三次实验,比如对一块组织,提了三次RNA,做三次real time。
2、为什么设置生物学重复
a、能够消除组内误差
b、增强结果的可靠性
c、检测离群样本:异常样本的存在,会严重影响实验结果的准确性,通过计算样本间的相关性可以发现异常样本,将其排除
3、生物学重复设置几个合适?
答案是至少3个,有条件越多越好,当然这不是信口乱说的,有文献支持的。
2016年英国邓迪大学的Geoffrey J Barton教授在RNA发表一篇文章专门探讨了这一问题。作者对野生型和snf2突变型酵母样品分别测序了48个生物学重复;质控后,野生型样品保留42个生物学重复,突变型样品剩余44个生物学重复。
在控制假阳性率为0.05的标准下,用所有可用生物重复计算出的差异基因定义为该差异基因鉴定工具的金标准差异基因集。
作者评估了11个常用的差异基因分析工具,性能最好的是edgeR, DESeq2和limma。
下面以edgeR为例展示了不同生物学重复数目对鉴定差异基因的影响。
在控制相同的假阳性率水平下,不同的生物学重复鉴定出的差异基因数目 (nr: number of biological replicates)。作者从所有生物重复中随机抽取2组、3组、4组…生物学重复,分别计算差异基因,发现:
差异基因的数目整体与生物重复数量正相关。
差异基因数目的稳定性与生物重复数量负相关。
生物重复较少时,不同的抽样导致的差异基因数目波动较大。
生物重复较多时,检测出的差异基因数目受抽样影响较小,体现在柱状图数据分布更集中 。