圆形布局对于展示复杂多个分类、多维数据以及不同元素间的联系。Circos是一个常用的展示圆形布局图形的软件,它由perl语言编写,在使用时需要编辑配置文件用来设置图形的各项参数。circlize包的目的是使用R语言实现circos的功能。R语言可以实现数据分析和可视化,因此在R中可以方便的以交互的方式实现circos图绘制。
1.1 设计原则
首先应明确几个概念。一个circos图由扇区(sectors)和轨道(tracks)组成。不同分类的数据在分布在不同的扇区上,同一个分类的多个维度的数据在不同的轨道上堆叠。一个扇区和一个轨道的交点就是一个单元格(cell、grid或者panel),是circos图中基本的绘图单位。
大多数图形都是由点、线、多边形等简单的元素组合而成。circlize可以在circos图中添加这样的低级图形,并且通过它们之间的不同组合实现各种复杂的图形。这一点可以使circlize具有更高的灵活性。
circlize包中有以下几个低级绘图函数:
-
circos.points()
:绘制点图; -
circos.lines()
:绘制折线图; -
circos.segments()
:绘制线段; -
circos.rect()
:绘制矩形; -
circos.polygon()
:绘制多边形; -
circos.text()
:添加文本; -
circos.axis()
和circos.yaxis()
:绘制坐标轴;
以下函数绘制circos图中两个位置之间的链接:
circos.link()
以下函数绘制高级图形:
-
circos.barplot()
:绘制条形图; -
circos.boxplot()
:绘制箱线图; -
circos.violin()
:绘制小提琴图; -
circos.heatmap()
:绘制圆形热土; -
circos.raster()
:绘制栅格图; -
circos.arrow()
:绘制圆形箭头;
以下函数排列circos图的圆形布局:
-
circos.initialize()
:分配扇区; -
circos.track()
:在一个轨道上为不同单元格创建绘图区域; -
circos.update()
:更新已经存在的单元格; -
circos.par()
:设置或查看绘图参数,起始角度,轨道高度等; -
circos.info()
:查看当前circos图的基本参数,扇区数据、轨道数目、当前绘图区域等; -
circos.clear()
:重置图形参数和内部变量;
1.2 简单的演示
我们通过一个简单的示例来了解circlize的基本使用方式。
首先生成一个随机数据集,包含一个字符向量sectors表示分类,还有两个数值向量x和y。
set.seed(999)
n = 1000
df = data.frame(sectors = sample(letters[1:8], n, replace = TRUE),
x = rnorm(n), y = runif(n))
然后初始化圆形布局。按照不同分类的x轴变量(即以下代码的df$x
)的范围对不同扇区的比例进行分配。扇区从θ=0的位置(3点钟方向)开始沿顺时针方向排列。虽然进行初始化,但是并没有绘制轨道,因此并没有图形生成。
library(circlize)
circos.par("track.height" = 0.1)
circos.initialize(df$sectors, x = df$x)
在最开始通过track.height
参数设置轨道高度为0.1,代表圆形半径的10%。在初始化之后就可以使用circos.trackPlotRegion()
或circos.track()
函数创建轨道,随后就可以使用低级图形函数在轨道上绘制图形。每一个轨道需要一个统一的y轴范围,可以根据y
参数自动计算或者使用给ylim
参数提供一个二元数值向量确定y轴范围。
circos.track(df$sectors, y = df$y,
panel.fun = function(x, y) {
circos.text(CELL_META$xcenter,
CELL_META$cell.ylim[2] + mm_y(5),
CELL_META$sector.index)
circos.axis(labels.cex = 0.6)
})
col = rep(c("#FF0000", "#00FF00"), 4)
circos.trackPoints(df$sectors, df$x, df$y, col = col, pch = 16, cex = 0.5)
circos.text(-1, 0.5, "text", sector.index = "a", track.index = 1)
在上面的一段代码中,circos.track()
用于创建新的轨道,逐个生成单元格。circos.track()
内部有一个panel.fun()函数用于在生成的单元格同时在单元格内绘制自定义图形,使用circos.axis()
生成坐标轴和使用circos.text()
添加扇区名称。CELL_META
指“元信息,meta information”。
在创建好第一个轨道后,使用circos.trackPoints()
函数在其中绘制点图。还有另一种形式向当前轨道添加点图,就是在panel.fun()
函数内使用circos.points()
函数。
低级绘图函数也可以在panel.fun()
外使用。上面代码最后一句使用circos.text()
在指定的单元格内添加文本“text”。使用sector.index
和track.index
参数指定需要添加图形单元格。
在第二个轨道里绘制直方图。circos.trackHist()
是一个高级绘图函数,因此可以创建新的轨道并绘图。
bgcol = rep(c("#EFEFEF", "#CCCCCC"), 4)
circos.trackHist(df$sectors, df$x, bin.size = 0.2, bg.col = bgcol, col = NA)
在第三个轨道里绘制折线图。按照每个单元格随机抽取10个点排序并连线。在
circos.track()
设置sectors
、x
和y
三个参数,其中df$x
和df$y
按照df$sectors
分类并传递给panel.fun()
的x
和y
参数。
circos.track(df$sectors, x = df$x, y = df$y,
panel.fun = function(x, y) {
ind = sample(length(x), 10)
x2 = x[ind]
y2 = y[ind]
od = order(x2)
circos.lines(x2[od], y2[od])
})
前面已经绘制好的图形可以通过
circos.updatePlotRegion()
或circos.update()
更新。这个函数需要sector.index
和track.index
参数明确指定需要更新的单元格,但并能更改xlim
、ylim
等设定。随后可以使用低级绘图函数重新在指定单元格添加图形元素。
circos.update(sector.index = "d", track.index = 2,
bg.col = "#FF8080", bg.border = "black")
circos.points(x = -2:2, y = rep(0.5, 5), col = "white")
circos.text(CELL_META$xcenter, CELL_META$ycenter, "updated", col = "white")
尽管在上一段代码重新指向第二个轨道,但如果要添加新的轨道,它依然会出现在最内层。接下来使用
circos.rect()
函数绘制热图。
circos.track(ylim = c(0, 1), panel.fun = function(x, y) {
xlim = CELL_META$xlim
ylim = CELL_META$ylim
breaks = seq(xlim[1], xlim[2], by = 0.1)
n_breaks = length(breaks)
circos.rect(breaks[-n_breaks], rep(ylim[1], n_breaks - 1),
breaks[-1], rep(ylim[2], n_breaks - 1),
col = rand_color(n_breaks), border = NA)
})
在circos图的中间,使用
circos.link()
绘制连线或条带链接不同点和区间。
circos.link("a", 0, "b", 0, h = 0.4)
circos.link("c", c(-0.5, 0.5), "d", c(-0.5,0.5), col = "red",
border = "blue", h = 0.2)
circos.link("e", 0, "g", c(-1,1), col = "green", border = "black", lwd = 2, lty = 2)
最后需要重置绘图参数和内部变量,以免影响绘制下一个图形。
circos.clear()
参考资料
Chapter 1 Introduction | Circular Visualization in R (jokergoo.github.io)