RRA是一种对排名进行整合,获得一个综合性排名列表的算法。
- 原始排名 -> 相对值
- 对于每个基因,对应的rank vector r=(r1, ..., rn)
- RRA computes a P-value ρk for the kth smallest value based on the beta distribution.
若𝑋(𝑘)是𝑈(0,1)的第𝑘个次序统计量,则
𝑋(𝑘)∼𝛽(𝑘,𝑛−𝑘+1). - 如果一个基因一共在n个样本内出现,则其排名向量内有n个排名,所以假设检验后也会获得n个p值。取其中最小的p值来代表这个基因。称之为rho score。Rho score = min (pij)
- Rho score不是精确的p值,当总的基因数不是很多(~100)的时候,原文建议可以使用bonferroni校正rho score,得到的padj很接近p值的上界。
参考资料
- 「R」Robust Rank Aggregation 算法介绍 - 云+社区 - 腾讯云
- Robust rank aggregation for gene list integration and meta-analysis
- 排名聚合之前的常用算法:[技术博客] 较科学的排名算法介绍与实现 - 提不起劲想赶紧完工 - 博客园
- 博士论文:跨平台芯片数据整合分析挖掘胃癌潜在关键基因构建预后评估模型及其生物学功能研究 2.2.4
- 数理统计4:均匀分布的参数估计,次序统计量的分布,Beta分布 - 江景景景页 - 博客园