Literature Review(1): A short but comprehensive comparison about tSNE, UMAP and PCA

最近又有大佬发Nature Protocols了,题目为Tutorial: guidelines for annotating single-cell transcriptomic maps using automated and manual methods,主要讲的是怎样做好单细胞的细胞类型注释工作,包括自动注释、手动标注以及最后的验证3个步骤。不过,我却在这篇文章中的一个box里面发现了他们对tSNE和UMAP的理解,以下为原文:

An scRNA-seq data set is typically visualized as a 2D scatter plot where cells (points) with similar transcriptomes are placed near each other. This 2D representation is projected from a higher dimensional space where each cell is described by the expression of thousands of genes, each of which is considered a separate dimension. The three most popular projection methods used for scRNA-seq data are t-SNE, UMAP and PCA.

t-SNE (Fig. 6c) is a nonlinear projection that preserves local groups of similar cells, while equalizing the density of cells within each group. The scale of a ‘local group’ is controlled by the ‘perplexity’ parameter, with higher values creating larger local groups. t-SNE effectively visualizes distinct robust clusters, making it easy to observe discrete cell types; however, global relationships between cell types are not maintained, and thus cluster-to-cluster relationships cannot be inferred and may be misleading. Cell subtypes can be combined into one large cluster or split into distinct plot regions depending on the perplexity.

UMAP (Extended Data Fig. 1) is a nonlinear projection method that differentiates discrete cell clusters20. UMAP is typically regarded as better for visualizing global relationships and gradients than t-SNE, although these differences are probably due to default parameters. UMAP is often less computationally intensive to run than t-SNE.

PCA (Fig. 6b) performs a linear transformation of normalized and scaled scRNA-seq data, to identify independent principal components (PCs) that capture major axes of variation in the data, which could represent biological factors, like cell types and states, or technical factors. PCs are ranked in decreasing order of variance, and typically the first two PCs are used to visualize the data, but more can be considered to detect more subtle expression patterns between cells. PCA can be useful for visualizing cell gradients and states.

Although these methods visually group similar cells and help visualize clusters, they do not define clusters and, therefore, are not clustering algorithms. Cell-clustering algorithm output is typically visualized as colors on the plot, and these colors may or may not correspond to patterns observed in the 2D plot.

其中的两张图(Fig. 6b, 6c and Extended Data Fig. 1)如下:

Fig. 6b

Fig. 6c
Extended Data Fig. 1

简单来说,tSEN和UMAP都属于非线性降维,但是tSNE能够让不同的细胞cluster之间很好的在二维图上彼此区分开来,却不能在全局范围内保留不同细胞类型之间的相互关系,二维图上的细胞cluster紧密程度由perplexity,即困惑度这个参数控制,困惑度越高,cluster中细胞聚集的越紧密。

相比之下,UMAP就能够很好的展示不同细胞类型之间的相互关系,并且UMAP相较之于tSEN来说会有更少的运行时间和内存占用。

PCA是一种线性降维的方式,通过PCA分析能够捕捉到数据当中的主要差异,且不同PC的差异度按照PC_1、PC_2、……逐渐减少,所以我们在后续UMAP和PCA分析时可以选用前一部分PC进行分析,所以说PCA降低了数据的维度。

最后,附上原文链接:https://www.nature.com/articles/s41596-021-00534-0

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,125评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,293评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,054评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,077评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,096评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,062评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,988评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,817评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,266评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,486评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,646评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,375评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,974评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,621评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,642评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,538评论 2 352

推荐阅读更多精彩内容