前言
还记得Immugent最开始做数据挖掘时,最常做的分析之一就是用ESTIMATE包来评估肿瘤组织的免疫浸润情况,虽然得到的结果只有stromal score,immune score,estimate score和pirity score四个值,但是其准确性是相当高的!当然后面出现了很多新型的反卷积软件,细胞类型页越来越细化,但是ESTIMATE包依然频繁出现在最新发表的各类文章中。
ESTIMATE包是从表达数据推断肿瘤纯度的基础,但缺乏相关介绍文档,而且有时它的功能在做得不够的情况下越界。tidyestimate包是ESTIMATE的更新,目的是在维护这个包的优秀功能时,增加它的文档和功能范围。
下面Immugent就来介绍一下tidyestimate包。。。
代码流程
首先回顾一下优秀的ESTIMATE包,它最初的文章在2013年发表在NC上,起点还是挺高的。

image.png
这么优秀的包,当然引用率是非常客观的,截止到目前已经被4000+的文章引用过了。

image.png
install.packages("tidyestimate")
#or
devtools::install_github("KaiAragaki/tidy_estimate")
这次更新的特点主要包括以下内容:

image.png
那么下面就开始探索一下这个新包吧!
library(tidyestimate)
dim(ov)
#> [1] 17256 10
head(ov)[,1:5]
#> s516 s518 s519 s520 s521
#> C9orf152 4.8815 4.5757 3.7395 3.6960 4.1597
#> ELMO2 7.2981 7.5554 7.5332 7.3824 7.3079
#> CREB3L1 5.5692 5.7004 5.9597 5.7700 5.2190
#> RPS11 13.3899 13.8488 13.6429 13.6546 13.5698
#> PNMA1 9.3480 10.0092 10.4310 9.5399 9.6423
#> MMP2 7.6182 8.0369 8.9551 10.3875 7.4141```
这个新包继续延续之前之前简便的特点,运行起来也很简便,一行代码搞定。
scores <- ov |>
filter_common_genes(id = "hgnc_symbol", tell_missing = FALSE, find_alias = TRUE) |>
estimate_score(is_affymetrix = TRUE)
> 461 of 488 missing genes found matches using aliases.
>
> Found 10364 of 10391 genes (99.74%) in your dataset.
> Number of stromal_signature genes in data: 141 (out of 141)
> Number of immune_signature genes in data: 141 (out of 141)
scores
> sample stromal immune estimate purity
> 1 s516 -285.49841 165.75062 -119.7478 0.8323791
> 2 s518 -429.16931 99.71302 -329.4563 0.8490421
> 3 s519 -60.98619 -368.70314 -429.6893 0.8567232
> 4 s520 1927.51431 2326.15984 4253.6742 0.3348246
> 5 s521 -673.84954 141.72775 -532.1218 0.8643812
> 6 s522 1447.95517 1166.51854 2614.4737 0.5497248
> 7 s523 -271.15756 -928.44921 -1199.6068 0.9094242
> 8 s525 965.61804 1310.27775 2275.8958 0.5905450
> 9 s526 545.99467 2149.10473 2695.0994 0.5398002
> 10 s527 -710.44370 1303.08009 592.6364 0.7699846
They can also be plotted in context of the Affymetrix profiled tumors used to generate the ESTIMATE model:
scores |>
plot_purity(is_affymetrix = TRUE)
A more detailed version of this example can be found in the vignette of this package.
* * *
## 说在最后
Immugent已经对tidyestimate包做过一些简单的测试,在没有降低准确性的同时,确实提速了不少。但是有一说一,tidyestimate包其实还可以做一些别的方面的升级,比如增加数据的适用性,或者联合其它分析流程,毕竟现在主打的就是一个集合与多功能。
好啦,本次介绍到这里就结束啦,我们下次再会~~