34统计基础- 分位数标准化(Quantile Normalization)

假设我们有一些来自微阵列实验的数据

如果你不熟悉微阵列,这里有解释:

  1. 微阵列测量样本中基因的活性。

  2. 他们通过测量不同颜色的光的强度来做到这一点。

  3. 如果你在一个实验中有一个更好的灯泡,那么每个测量结果都可能比另一个实验的结果更大。

因此,我们需要标准化数据来解释实验之间的技术差异,这与生物学无关。

这是我们的数据。在这张图中,每种颜色代表一个不同的基因。这些颜色与实际微阵列实验中扫描到的颜色不同。此时,那些颜色已经转换为强度值。每个样本都有不同的平均值,这表明我们需要对不同的整体光强进行补偿。分位数标准化(Quantile Normalization)纠正了这个技术。

  1. 先关注每个样本中表达最高的基因

  2. 然后计算三个样本中表达最高基因的平均值

  3. 表达量最高的基因的分位数归一化值为其平均值

  4. 现在把注意力集中在每个样本中第二个高表达基因上,重复步骤1-3,知道标准化所有基因。

image-20201228165900664.png

分位数标准化(Quantile Normalization)后,每个样本的值都相同,但是原始的基因顺序被保留了下来。他们称之为“Quantile Normalization”,因为标准化的数据集有分位数相同。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容