转录组不求人系列(四):UMAP分析及可视化

什么是UMAP?和PCA一样,一种降维的算法,如果不是统计学或者数据专业的人,我建议不要去看它的原理,知道如何用就足够了。

也许听到UMAP最多的是对单细胞数据的分析降维,类似于下图:

图片

然而其他数据,像大样本的转录组在PCA降维效果不好的时候,可以使用UMAP,毕竟现在转录非常便宜,随便测几十个样品和玩似的。

首先构建一个数据集,行为样本,列为基因,并对样本的特征进行分组。

图片

读入数据:


setwd("E:/生物信息学")
options(stringsAsFactors= F)####
A <- read.csv("UMAP.csv",header = T,row.names = 1)

安装R包:


install.packages("umap")
library(umap)

UMAP分析:


A_umap <- A[,colnames(A)!= c('label2', 'label3','label4')]#新构建一个表,不含有label
A_umap <- data.frame(t(apply(A_umap,1,
                             function(v){(v-mean(v,na.rm=T))/sd(v,na.rm=T)})),
                     stringsAsFactors=F)#标准化
umap <- umap(A_umap,method='naive',n_neighbors = 10)    
head(umap$layout)    
#####################
       [,1]      [,2]
r1 16.16427 -11.32371
r2 16.26652 -11.21803
r3 16.28917 -11.45600
r4 16.28618 -11.56981
r5 16.15085 -12.07527
r6 16.65784 -12.28240        

提取分析结果用于作图:


B <- data.frame(umap$layout)
B$label <- A$label2 
colnames(B) <- c('UMAP_1','UMAP_2','label')

作图是由ggplot实现的,应该很熟悉了:

ggplot(B, aes(x=UMAP_1, y=UMAP_2, colour=label)) + 
  geom_point(size=1)+ xlab("UMAP_1")+ ylab("UMAP_2")+ 
  theme(  panel.grid.major = element_blank(),
                 panel.grid.minor = element_blank(),
                 legend.title=element_blank(), 
                 panel.border = element_blank(),
                 axis.line.x = element_line(color="black", size = 0.5),
                 axis.line.y = element_line(color="black", size = 0.5),
                 panel.background = element_blank())
图片

降维效果很好,当然图的颜色也是可以修改的,和之前讲的ggplot的修饰一样。除了对样本的分组,还可以展现其他的分组,毕竟数据中我们设置了3

个label,我们看一下以性别的分组作图是什么样的?只需要改动下label即可。


C <- data.frame(umap$layout)
C$label <- A$label3 
colnames(C) <- c('UMAP_1','UMAP_2','label') 
ggplot(C, aes(x=UMAP_1, y=UMAP_2, colour=label)) + 
  geom_point(size=1)+ xlab("UMAP_1")+ ylab("UMAP_2")+ 
  theme(panel.grid.major = element_blank(),
                 panel.grid.minor = element_blank(),
                 legend.title=element_blank(), 
                 panel.border = element_blank(),
                 axis.line.x = element_line(color="black", size = 0.5),
                 axis.line.y = element_line(color="black", size = 0.5),
                 panel.background = element_blank())
图片

效果不错!

样本多可以试试这个方法,不局限于转录组,其他的任何数据都可以!

下节预告---TSNE降维分析

想要示例数据的可以打赏截图联系作者获取,记得留下邮箱!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容