【R画图学习24.3】ComplexHeatmap绘制复杂热图(3)

接着上个帖子,这个帖子主要学习文字注释的一些技巧。

1. 文字注释

文本可以用anno_text()注释。图形参数由gp控制。

ha = rowAnnotation(foo = anno_text(month.name, gp = gpar(fontsize = 1:12+4)))

位置由location和just控制。旋转由rot控制。

ha = rowAnnotation(foo = anno_text(month.name, location = 1, rot = 30,

    just = "right", gp = gpar(fontsize = 1:12+4)))

ha = rowAnnotation(foo = anno_text(month.name, location = 0.5, just = "center"))

location和just根据放置在热图中的注释的位置自动计算(例如,如果文本是热图的右注释,则文本向左对齐,如果它是左注释则向右对齐)。

宽度/高度是根据所有文本自动计算的。通常你不需要手动设置它的宽度/高度。

可以通过gp设置背景颜色。这里fill控制填充背景颜色,col控制文本颜色,border控制背景边框颜色。

可以看出,我们明确设置width为最长文本宽度的 1.2 倍。

ha = rowAnnotation(foo = anno_text(month.name, location = 0.5, just = "center",

    gp = gpar(fill = rep(2:4, each = 4), col = "white", border = "black"),

    width = max_text_width(month.name)*1.2))

与其他注释不同,默认情况下文本注释没有注释标题。标题可以在anno_text()通过设置show_name = TRUE被添加。

Heatmap(mat1) + rowAnnotation(month = anno_text(month.name[1:12], just = "center",

        location = unit(0.5, "npc"), show_name = TRUE),

    annotation_name_rot = 0)

2. 标记注释

有时热图中有很多行或列,我们想标记其中的一些。anno_mark()用于标记行或列的子集并用线连接到标签。anno_mark()至少需要两个参数:at、labels,其中at是原始矩阵的索引和labels相应的文本。

m = matrix(rnorm(1000), nrow = 100)

rownames(m) = 1:100

ha = rowAnnotation(foo = anno_mark(at = c(1:4, 20, 60, 97:100), labels = month.name[1:10]))

Heatmap(m, name = "mat", cluster_rows = FALSE, right_annotation = ha,

    row_names_side = "left", row_names_gp = gpar(fontsize = 4))

Heatmap(m, name = "mat", cluster_rows = FALSE, right_annotation = ha,

    row_names_side = "left", row_names_gp = gpar(fontsize = 4), row_km = 4)

3. 摘要注释

有一个特殊的注释anno_summary()只适用于一列热图或一行热图(我们可以说热图只包含一个向量)。它显示了热图中向量的汇总统计信息。如果相应的向量是离散的,则摘要注释显示为条形图,如果向量是连续的,则摘要注释是箱线图。 anno_summary()总是在热图分割时使用,以便可以在热图切片之间比较统计数据。

第一个示例显示了离散热图的摘要注释。条形图显示每个切片中每个级别的比例。热图切片的高度已经可以看到绝对值。条形图的颜色模式是从热图中自动获取的。

ha = HeatmapAnnotation(summary = anno_summary(height = unit(4, "cm")))

v = sample(letters[1:2], 50, replace = TRUE)

split = sample(letters[1:2], 50, replace = TRUE)

Heatmap(v, name = "mat", col = c("a" = "red", "b" = "blue"),

    top_annotation = ha, width = unit(2, "cm"), row_split = split)

下面是个连续变量的例子:

ha = HeatmapAnnotation(summary = anno_summary(gp = gpar(fill = 2:3),

    height = unit(4, "cm")))

v = rnorm(50)

Heatmap(v, name = "mat", top_annotation = ha, width = unit(2, "cm"),

    row_split = split)

通常我们不会绘制这个单列热图。它总是与其他“主要热图”结合在一起。

m = matrix(rnorm(50*10), nrow = 50)

ht_list = Heatmap(m, name = "main_matrix")

ha = HeatmapAnnotation(summary = anno_summary(height = unit(3, "cm")))

v = sample(letters[1:2], 50, replace = TRUE)

ht_list = ht_list + Heatmap(v, name = "mat1", top_annotation = ha, width = unit(1, "cm"))

ha = HeatmapAnnotation(summary = anno_summary(gp = gpar(fill = 2:3),

    height = unit(3, "cm")))

v = rnorm(50)

ht_list = ht_list + Heatmap(v, name = "mat2", top_annotation = ha, width = unit(1, "cm"))

split = sample(letters[1:2], 50, replace = TRUE)

lgd_boxplot = Legend(labels = c("group a", "group b"), title = "group",

    legend_gp = gpar(fill = c("red", "blue")))

draw(ht_list, row_split = split, ht_gap = unit(5, "mm"),

    heatmap_legend_list = list(lgd_boxplot))

4. 缩放或者链接注释

anno_mark()将热图上的单行或单列连接到标签,注释功能anno_link()将行或列的子集连接到可以添加更全面图形的绘图区域。

m = matrix(rnorm(100*10), nrow = 100)

subgroup = sample(letters[1:3], 100, replace = TRUE, prob = c(1, 5, 10))

rg = range(m)

panel_fun = function(index, nm) {

    pushViewport(viewport(xscale = rg, yscale = c(0, 2)))

    grid.rect()

    grid.xaxis(gp = gpar(fontsize = 8))

    grid.boxplot(m[index, ], pos = 1, direction = "horizontal")

    popViewport()

}

anno = anno_link(align_to = subgroup, which = "row", panel_fun = panel_fun,

    size = unit(2, "cm"), gap = unit(1, "cm"), width = unit(4, "cm"))

Heatmap(m, name = "mat", right_annotation = rowAnnotation(foo = anno), row_split = subgroup)

anno_link() 也适用于列注释。

5. 多重注释

要在HeatmapAnnotation()中放置多个注释,只需将它们指定为名称-值对。在HeatmapAnnotation()中,有一些参数控制多个注释。对于这些参数,它们被指定为长度与注释数量相同的向量,或具有注释子集的命名向量。被指定为向量、矩阵和数据框的简单注释将自动在热图上有图例。show_legend控制是否为它们绘制图例。

注意:如果show_legend是向量,则show_legend的值应为以下格式之一:

长度与简单注释数量相同的逻辑向量。

一个与totla注释数量相同长度的逻辑向量。复杂注释的值将被忽略。

用于控制简单注释子集的命名向量。

除此之外,注释还有很多样式的控制参数。比如:gp控制简单注释的图形参数(除了fill),例如注释网格的边框。

border控制每个注释的边界。 show_annotation_name控制是否显示注释名称。如前所述,该值可以是单个值、向量或命名向量。

annotation_name_gp, annotation_name_offset,annotation_name_side和 annotation_name_rot控制注释名称的样式和位置。后三个可以指定为命名向量。如果 annotation_name_offset指定为命名向量,则可以指定为字符而不是unit对象:annotation_name_offset = c(foo = "1cm")。annotation_label参数设置注释的替代标签。

gap控制每两个相邻注释之间的空间。该值可以是单个值或单位向量。

height, width,annotation_height并annotation_width控制完整热图注释的高度或宽度。通常你不需要设置它们,因为所有单个注释都有固定的高度/宽度,整个热图注释的最终高度/宽度是它们的总和。

ha = HeatmapAnnotation(foo = 1:10,

    bar = cbind(1:10, 10:1),

    pt = anno_points(1:10),

    show_legend = c("bar" = FALSE)

)

Heatmap(matrix(rnorm(100), 10), name = "mat", top_annotation = ha)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容