前言
接下去的部分,我们要开始介绍层次关系与网络关系图片的绘制。
层次关系型图标主要用于表达个体之间的层次关系,通常可以用来展示分类的多级关系,例如层次聚类的树状图、节点连接图、冰柱图、旭日图、圆填充图、矩形树状图等
不同于层次关系结构,网络关系结构并不是自底向上或自顶向下的层次结构,展示了不同元素之间的更加自由和复杂的相互关系。如桑葚图、和弦图、弧长链接图、蜂箱图、边绑定图等。
在图论中,图是由若干个节点或顶点(node 或 vertex)和连接两个节点的边(edge)构成的图形,用于表示事物之间的关系,而树也是图的一种。
在生物信息领域,最常见的网络图应该就是基因/蛋白质互作网络图,例如常见的 KEGG 通路图,而 GO 通路则是以树的形式展现各生物学过程之间的包含、并列关系。
在 R 中,绘制这些图形的包也比较多,如 igraph、ggraph、circlize。而我们也主要介绍这三个包。
在开始绘制这些图形之前,我们先从介绍包的使用开始。首先是 igraph
igraph
igraph 是一个集成的高效且易于使用的网络分析工具,可以在 R、Python、C/C++ 和 Mathematica 中使用。
安装导入
install.packages("igraph")
library(igraph)
创建图形
1. 创建简单图形
使用 graph 或 make_graph 函数可以创建一个简单的有向图
g <- graph(edges = c(1, 2, 2, 3, 3, 4, 5, 6))
# g <- make_graph(edges = c(1, 2, 2, 3, 3, 4, 5, 6))
我们为 edges 参数传递了一个边向量,其中第一、二两个元素构成一条边,第三、四两个元素构成一条边,以此类推。
如果传递的是数值向量,会将值作为节点的 ID,字符向量的值将作为节点的名称,函数返回一个 igraph 对象
> class(g)
[1] "igraph"
直接将返回的 igraph 对象传递给 plot 函数,就可以显示图形
plot(g)

默认绘制的是有向图,可以设置 directed = FALSE 绘制无向图
g <- graph(edges = c("A", "B", "B", "C", "C", "D"), directed = FALSE)
plot(g)

也可以使用对应的简便函数来绘制有向图和无向图
directed_graph(...)
undirected_graph(...)
# 相当于
make_directed_graph(edges, n = max(edges))
make_undirected_graph(edges, n = max(edges))
例如
g <- undirected_graph(edges = c("A", "B", "B", "C", "C", "D"))
plot(g)

也可以传递字符标量
graph <- graph(
~ A-B-C-D-A, E-A:B:C:D,
F-G-H-I-F, J-F:G:H:I,
K-L-M-N-K, O-K:L:M:N,
P-Q-R-S-P, T-P:Q:R:S,
B-F, E-J, C-I, L-T, O-T, M-S,
C-P, C-L, I-L, I-P)
plot(graph)

或者传入预定义的一些图形名称
solids <- list(
graph("Tetrahedron"),
graph("Cubical"),
graph("Octahedron"),
graph("Dodecahedron"),
graph("Icosahedron"),
graph("Bull"),
graph("Coxeter"),
graph("Diamond"),
graph("Levi")
)
par(mfrow=c(3,3))
for (i in seq_along(solids)) {
x = (i - 1) %/% 3 + 1
y = (i - 1) %% 3 + 1
plot(solids[[i]])
}

2. 创建特定图形
2.1 特定图形
igraph 还提供了许多 make_* 形式的函数,用于创建不同结构的图
例如,创建一个环形图
g <- make_ring(10)

星形图
make_star(10, mode = "out")

栅格图
g <- make_lattice(length = 5, dim = 2)
构建一棵二叉树
g <- make_tree(10, 2)

创建全连接图
g <- make_full_graph(5)

创建一个没有边的图
g <- make_empty_graph(10)

2.2 随机图形
igraph 中提供的 sample_* 函数,用于生成随机图形
伯努利随机图,n、m 分别代表节点和边的个数
g <- sample_gnm(n = 20, m = 20)

n、p 分别设置节点个数和每两个节点之间绘制边的概率
g <- sample_gnp(n = 20, p = 1/10)

3. graph_from_literal
graph_from_literal 可以方便的创建较小的图,以传递表达式的方式来创建图形。
表达式由节点名称和边运算符组成,- 表示无向的边, + 表示有向边。边可以是任意长度,即可以添加任意数量的 -,如果只包含 -,则创建无向图。
例如
graph_from_literal(A-B)

graph_from_literal( A-----B, C--D, E--F, G--H, I, J, K )

: 操作符用于定义节点集合,如果连接两个集合,则集合中的每个节点都会与另一个集合相连
graph_from_literal( A:B:C:D -- A:B:C:D )

添加箭头
graph_from_literal( A +-+ B +---+ C ++ D + E)

在有向图中,只有包含 + 的边才会绘制,例如
graph_from_literal( A +- B -- C )

如果节点的名称包含空格或其他特殊字符,需要添加引号
graph_from_literal( "my" +- "salary is " -+ "$100" )

4. 从数据中创建
4.1 使用数据框创建
可以使用 graph_from_data_frame(或 from_data_frame) 函数从一个或多个包含节点或边的数据框中创建 igraph 对象。
graph_from_data_frame(d, directed = TRUE, vertices = NULL)
from_data_frame(...)
根据 vertices 参数是否为 null,会有两种不同的操作模式。
如果 vertices = NULL,则数据框的前两列表示边列表,剩下的列表示边的属性。
如果 vertices 不为空,则必须是一个包含节点信息的数据框。第一列将作为节点的名称,显示在图中,其他列作为节点的属性,且只保留边列表 d 中包含这些节点的边
示例
# 定义节点
actors <- data.frame(
name = c("Alice", "Bob", "Cecil", "David",
"Esmeralda"),
age = c(48, 33, 45, 34, 21),
gender = c("F", "M", "F", "M", "F")
)
# 定义边
relations <- data.frame(
from = c("Bob", "Cecil", "Cecil", "David",
"David", "Esmeralda"),
to = c("Alice", "Bob", "Alice", "Alice", "Bob", "Alice"),
same.dept = c(FALSE, FALSE, TRUE, FALSE, FALSE, TRUE),
friendship = c(4, 5, 5, 2, 1, 1),
advice = c(4, 5, 5, 4, 2, 3)
)
# 将数据转换为 igraph 对象
g <- graph_from_data_frame(
relations, directed = TRUE,
vertices = actors
)
plot(g)

as_data_frame 用于将 igraph 对象转换为一个或多个数据框。根据 what 参数来进行转换,可选的值为 c("edges", "vertices", "both")
> as_data_frame(g, what = "edges")
from to same.dept friendship advice
1 Bob Alice FALSE 4 4
2 Cecil Bob FALSE 5 5
3 Cecil Alice TRUE 5 5
4 David Alice FALSE 2 4
5 David Bob FALSE 1 2
6 Esmeralda Alice TRUE 1 3
> as_data_frame(g, what = "vertices")
name age gender
Alice Alice 48 F
Bob Bob 33 M
Cecil Cecil 45 F
David David 34 M
Esmeralda Esmeralda 21 F
如果为 both,则会将节点和边以数据框列表的形式返回
4.2 使用边列表
graph_from_edgelist 用于从边列表来创建 igraph 对象,接受一个包含两列的矩阵,每行定义了一条边。
el <- matrix( c("foo", "bar", "bar", "foobar"), nc = 2, byrow = TRUE)
g <- graph_from_edgelist(el)

创建一个环形图
g <- graph_from_edgelist(cbind(1:10, c(2:10, 1)))

4.3 邻接矩阵
graph_from_adjacency_matrix 是一个灵活的函数,能够使用邻接矩阵来创建 igraph 对象
graph_from_adjacency_matrix(adjmatrix, mode = c("directed", "undirected",
"max", "min", "upper", "lower", "plus"), weighted = NULL,
diag = TRUE, add.colnames = NULL, add.rownames = NA)
节点的顺序将依照矩阵的顺序排序,mode 参数各个值的含义为:
-
directed:有向图 -
undirected:无向图,与max一样 -
max:将max(A(i,j), A(j,i))作为无向图边的值 -
upper:使用上三角来构建无向图 -
lower:使用下三角来构建无向图 -
min:将min(A(i,j), A(j,i))作为无向图边的值 -
plus:将A(i,j)+A(j,i)作为无向图边的值
如果 weighted 参数为 TRUE,会创建加权图
示例
adjm <- matrix(sample(0:1, 100, replace = TRUE, prob = c(0.9, 0.1)), nc = 10)
g1 <- graph_from_adjacency_matrix(adjm)
plot(g1)

g2 <- graph_from_adjacency_matrix(adjm, weighted=TRUE)

获取 igraph 对象节点的权重
> E(g2)$weight
[1] 1 1 1 1 1 1 1 1 1
设置行列名称
colnames(adjm) <- sample(letters, ncol(adjm))
rownames(adjm) <- seq(nrow(adjm))
g3 <- graph_from_adjacency_matrix(adjm, weighted=TRUE, add.rownames="code")
plot(g3)

4.4 图层
我们还可以使用类似 ggplot2 图层的方式,使用 + 来添加节点和边,例如
g <- make_empty_graph(directed = FALSE) +
vertices(LETTERS[1:10]) +
edges('A','B', 'B','D', 'C','D', 'D','E', 'E','G', 'F','G', 'G','H', 'H','I', 'I','J')
plot(g)

我们首先使用 make_empty_graph 创建一个空的图,默认为有向图,设置 directed = FALSE 来绘制无向图
然后,使用 + 来添加 vertices() 创建的结点和 edges() 创建的边
还可以使用 - 来删除某些节点或者边,例如
g <- make_empty_graph(directed = FALSE) +
vertices(LETTERS[1:10]) +
edges('A','B', 'B','D', 'C','D', 'D','E', 'E','G', 'F','G', 'G','H', 'H','I', 'I','J') -
vertices(LETTERS[5]) -
edges('A|B', 'I|J')
plot(g)

删除边的使用,传递给 edges() 的值略有不同,要删除的边为使用 | 连接两个节点名称的字符串形式