[R语言] Heatmap绘图经验总结

热力图(Heatmap)是统计学习中不可或缺的图形之一,在生信领域中尤为常见,它通过颜色的深浅程度来判断不同类别间的差异,通常结合数据特征的相关系数矩阵来判断其显著性。此外,还可以借助热力图呈现不同特征间的聚类关系,即利用不同特征的差异程度(利用相关系数矩阵、欧氏距离等度量方式),对其做聚类分析(如层次聚类,kmeans聚类等)。这里利用R语言中的相关R包,来介绍我的一些Heatmap绘图经验。

一、前期准备
1. 所用软件与版本:R 4.0.5
2. 所需R包:ggplot2 , Corrplot, pheatmap, dendextend, ggplotify, cowplot, ggpubr
3. 示例数据:随机生成的数据
二、教程
2.1 生成数据
set.seed(123)
dat =  matrix(runif(5*5,0,1),nrow=5)
rownames(dat) = paste0("s",1:ncol(dat))
colnames(dat) = paste0("f",1:nrow(dat))

这里随机生成了25个0,1之间的均匀分布的随机数,其中,行是样本,列是特征,如图:

data
2.2 方案一 Corrplot

第一种方案绘制的Heatmap需要借助于Corrplot包,我们求出dat特征的相关系数矩阵,进一步利用corrplot函数来画图,在该包的官方文档中,对于corrplot函数的参数描述可以说是非常多,这里我给出几种常用的参数:

method 表示热力图中每一块所展示的形状,可选值有: "circle", "square", "ellipse", "number", "shade", "color", "pie";

type 表示相关系数矩阵展示的方式,比如只展示上三角或下三角或者全部展示,可选值有:“full”,“upper","lower”;

tl.pos 指定文本标签(变量名称)的位置,当type=full时,默认标签位置在左边和顶部(lt),当type=lower时,默认标签在左边和对角线(ld),当type=upper时,默认标签在顶部和对角线,d表示对角线,n表示不添加文本标签;

diag 表示对角线上取值,默认为FALSE;

cl.pos 表示图例位置,当type=upper或full时,图例在右方,当type=lower时,图例在底部,不需要图例时,需指定该参数为n;

...
下面给出方法运用:

Cor  = cor(dat,method = "pearson")
corrplot:: corrplot(corr = Cor, method = "color",type = "upper", tl.pos = "lt")
corrplot::corrplot(corr = Cor,add = TRUE, type = "lower", method = "number", diag = FALSE, tl.pos = "n", cl.pos="n")
task 1

当然,利用corrplot函数画图可以实现图层的叠加,上面这张图就是分上下两部分完成的,其中默认的颜色样式个人觉得还是可以的,只不过对于相关系数值会根据高低颜色深浅会发生变化,对于一些相关性低的值颜色会非常浅,所以看得不是很明显。
关于这个包具体的的使用方法可以参考这位博主写的文章:

(2条消息) R语言绘制热图(其实是相关系数图)实践(二)corrplot包_暴躁的搬砖工…-CSDN博客_corrplot

2.3 方案二 pheatmap

这里我们还是用方案一随机生成的矩阵,介绍用pheatmap包来绘制热力图。pheatmap包里关于绘制热力图的参数相对来说比较少,可以帮助我们快速的绘图,这里给出一些常用参数:

color 设置渐变的颜色,通常借助于colorRampPalette函数,比如说设置红黄蓝渐变,并在这之间分成50个等级,我们可以设置color=colorRampPalette(c("red","yellow","blue"))(50);

cluster_cols & cluster_rows 表示是否按行或列聚类,默认值为FALSE;

clustering_method 表示聚类方法,默认是complete,此外还"ward.D",“single”,“average”,等;

display_numbers 表示是否在heatmap里面显示数值,默认是FALSE;

show_rownames & show_colnames 表示是否显示行名或列名;

file 设置图片保存位置
...

下面给出方法运用

Cor  = cor(dat,method = "pearson")
pheatmap::pheatmap(Cor, cluster_row = FALSE,cluster_col=FALSE )
task 2

去掉边框线可能会好看一点:

pheatmap::pheatmap(Cor, cluster_row = FALSE,cluster_col=FALSE ,border=FALSE)
border=FALSE

由于是随机生成的数据,就不显示聚类的效果(只需要把cluster_row和cluster_col删掉即可),总体来说用pheatmap绘制热图会相对简单一点,但是毫不逊色于其他包绘制的热图。此外,如果想对于行或列来显示一些注释信息(annotation),比如将特征分成2类,每一类是不同的颜色,这里就可以先生成一个行名是特征,列名是分类结果的数据框,然后利用annotation_row(或col)参数,将生成的数据框赋给它即可,具体可以参考这位博主的文章:

使用pheatmap包绘制热图 - 简书 (jianshu.com)

2.4 方案三 ComplexHeatmap

接下来介绍的ComplexHeatmap包就比较全面了,他可以兼容pheatmap函数的所有功能,可以说是pheatmap包的加强版,能够创建更加复杂的热力图,如果你会pheatmap包的应用,那么在ComplexHeatmap包里面,你只需要指明是该包下的pheatmap函数即可使用(ComplexHeatmap::pheatmap())。接下来列举出一些常用参数:

name 、column_title、row_title设置图例、列标题与行标题的名字;

column_title_side & row_title_side 设置列标题与行标题的位置,之注意:列标题只能跟"top"或"buttom"参数,行标题只能跟"left"或"right"参数;

column_names_side & row_names_side 设置行名与列名的位置,后面跟的是位置参数,如"left"、"top"等;

column_names_rot & row_names_rot 设置行名与列名的倾斜角度,后面跟的是角度,如0、30、90等;

column_names_gp & row_names_gp 设置行名与列名的颜色,比如 column_names_gp =gpar(col=rep("red",5));

column_title_gp & row_title_gp 设置列与行标题的颜色,注意:这个需要和聚类分割的数量来决定,要指定row_split & column_split,颜色的设置才能生效;

col 设置渐变的颜色向量参数,这里推荐用RColorBrewer包中的颜色,比如 col = rev(brewer.pal(n = 7, name ="RdYlBu"));

cluster_rows & cluster_columns 表示是否对行列进行聚类,默认是TRUE;

cluster_rows & cluster_columns 表示是否对行列进行聚类,默认是TRUE,如果是特定值,则表示对聚类树进行处理;

row_dend_reorder & column_dend_reorder 表示将行或列进行排序,默认是TRUE,所以我们在利用这个包绘制相关系数热力图时,会看到对角线不是1,那么我们就需要检查是否设置了这个参数;

show_column_dend & show_row_dend 表示是否展示行与列的聚类树;

...

下面利用上述随机生成的数据来绘制heatmap:

library(dendextend)
dend = hclust(dist(Cor))
dend = color_branches(dend, k = 2)

Heatmap(Cor,
        name = "Color Key",
        col = rev(brewer.pal(n = 7, name ="RdYlBu")),
        cluster_rows = dend,
        cluster_columns = F,
        column_title = "This is a heatmap",
        column_title_side = "top",
        column_names_rot = 0 )
task 3

最值得一提的是,cluster_rows参数,可以结合hlust函数来使用,并通过color_branches函数来为不同类别设置颜色,使得整个heatmap看起来更加美观。如果我们要显示聚类后的数据分割并命名,我们可以这样:

dend = hclust(dist(Cor))
dend = color_branches(dend, k = 2)

Heatmap(Cor,
        name = "Color Key",
        col = rev(brewer.pal(n = 7, name ="RdYlBu")),
        cluster_rows = dend,
        cluster_columns = F,
        column_title = "This is a heatmap",
        column_title_side = "top",
        column_names_rot = 0,
        row_title = c("C1","C2"),
        row_split = 2,
        row_title_gp = gpar(col=c("red","blue"))
)
split

如若想得到更加详细的说明,可以看ComplexHeatmap包的官方文档,或者参见这位博主的文章:

使用ComplexHeatmap简单绘制热图 | KeepNotes blog (bioinfo-scrounger.com)

ComplexHeatmap绘制热图详细步骤 (360doc.com)

2.5 方案四 ggplot2

当然,画heatmap怎么能少的了ggplot2呢,我们在利用ggplot画图时,只需要设置scale_fill_gradient即可,例如:scale_fill_gradient(low = "yellow", high = "red") 表示颜色从黄色到红色渐变。注意要把数据处理成ggplot所需要的样式!下面来绘制heatmap:


Cor  = cor(dat,method = "pearson")
datm=reshape2::melt(Cor)

## import my theme for ggplot 
mytheme=theme_classic()+
  theme(axis.text.x = element_text( hjust = 0.5, vjust = 0.5,
                                    size=rel(1.25)),
        axis.text.y = element_text( hjust = 0.5, vjust = 0.5,
                                    size=rel(1.25)),
        axis.title.x = element_blank(),
        axis.title.y = element_blank(),
        axis.ticks = element_blank(),
        axis.line = element_blank(),
        plot.title=element_text(size=rel(1.5),hjust = 0.5),
        panel.grid.major = element_blank(), 
        panel.grid.minor = element_blank()
  ) 

## draw heatmap
ggplot(datm, aes(x=Var2, y=Var1, fill=value))+geom_tile()+
  ggtitle("Heatmap Example")+mytheme+
  scale_fill_gradient(low = "yellow", high = "red")
task 4

如果要实现聚类树在heatmap上,我们需要利用ggtree函数,分别绘制聚类树与热力图,最后用aplot包进行拼接即可。

三、后记
3.1 Combine1

由于ComplexHeatmap包绘制的热力图是一个Heatmap对象,故他与其他图形不同,自身可以与其他Heatmap对象结合,我们只需要利用"+"号或者"%v%"连接符对多个Heatmap对象进行水平或垂直连接就可以了。

3.2 Combine2

当我们需要将pheatmap包绘制的热力图与ggplot画的其他图贴在一起时,我们可以利用ggplotify包来实现,具体操作流程为:

  1. p1 = pheatmap(...)
  2. p1 = as.ggplot(p1)
  3. plot_grid(p1,p2,p3) 注:plot_grid函数在cowplot包里面

我们用上回利用iris数据集画组合小提琴图的例子,进一步组合heatmap:

[ggplot2]小提琴图经验总结 - 简书 (jianshu.com)

heatmap = pheatmap::pheatmap(Cor, cluster_row = FALSE,cluster_col=FALSE ,border=FALSE)
heatmap = as.ggplot(heatmap)
p$heatmap = heatmap
plot_grid(plotlist = p,align = "v",labels =  LETTERS[1:5],nrow = 2)
combine 2

当然ggplot也可以画heatmap,这里不再阐述,对于上面几种绘图方案,我们只需选取一种最美观,最有效的方式来画heatmap即可。

以上就是我对于绘制Heatmap的经验总结。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,186评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,858评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,620评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,888评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,009评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,149评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,204评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,956评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,385评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,698评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,863评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,544评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,185评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,899评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,141评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,684评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,750评论 2 351

推荐阅读更多精彩内容