R 数据可视化 —— igraph 创建图

前言

接下去的部分,我们要开始介绍层次关系与网络关系图片的绘制。

层次关系型图标主要用于表达个体之间的层次关系,通常可以用来展示分类的多级关系,例如层次聚类的树状图、节点连接图、冰柱图、旭日图、圆填充图、矩形树状图等

不同于层次关系结构,网络关系结构并不是自底向上或自顶向下的层次结构,展示了不同元素之间的更加自由和复杂的相互关系。如桑葚图、和弦图、弧长链接图、蜂箱图、边绑定图等。

在图论中,图是由若干个节点或顶点(nodevertex)和连接两个节点的边(edge)构成的图形,用于表示事物之间的关系,而树也是图的一种。

在生物信息领域,最常见的网络图应该就是基因/蛋白质互作网络图,例如常见的 KEGG 通路图,而 GO 通路则是以树的形式展现各生物学过程之间的包含、并列关系。

R 中,绘制这些图形的包也比较多,如 igraphggraphcirclize。而我们也主要介绍这三个包。

在开始绘制这些图形之前,我们先从介绍包的使用开始。首先是 igraph

igraph

igraph 是一个集成的高效且易于使用的网络分析工具,可以在 RPythonC/C++Mathematica 中使用。

安装导入

install.packages("igraph")

library(igraph)

创建图形

1. 创建简单图形

使用 graphmake_graph 函数可以创建一个简单的有向图

g <- graph(edges = c(1, 2, 2, 3, 3, 4, 5, 6))
# g <- make_graph(edges = c(1, 2, 2, 3, 3, 4, 5, 6))

我们为 edges 参数传递了一个边向量,其中第一、二两个元素构成一条边,第三、四两个元素构成一条边,以此类推。

如果传递的是数值向量,会将值作为节点的 ID,字符向量的值将作为节点的名称,函数返回一个 igraph 对象

> class(g)
[1] "igraph"

直接将返回的 igraph 对象传递给 plot 函数,就可以显示图形

plot(g)

默认绘制的是有向图,可以设置 directed = FALSE 绘制无向图

g <- graph(edges = c("A", "B", "B", "C", "C", "D"), directed = FALSE)

plot(g)

也可以使用对应的简便函数来绘制有向图和无向图

directed_graph(...)
undirected_graph(...)

# 相当于
make_directed_graph(edges, n = max(edges))
make_undirected_graph(edges, n = max(edges))

例如

g <- undirected_graph(edges = c("A", "B", "B", "C", "C", "D"))

plot(g)

也可以传递字符标量

graph <- graph( 
  ~ A-B-C-D-A, E-A:B:C:D,
  F-G-H-I-F, J-F:G:H:I,
  K-L-M-N-K, O-K:L:M:N,
  P-Q-R-S-P, T-P:Q:R:S,
  B-F, E-J, C-I, L-T, O-T, M-S,
  C-P, C-L, I-L, I-P)
plot(graph)

或者传入预定义的一些图形名称

solids <- list(
  graph("Tetrahedron"),
  graph("Cubical"),
  graph("Octahedron"),
  graph("Dodecahedron"),
  graph("Icosahedron"),
  graph("Bull"),
  graph("Coxeter"),
  graph("Diamond"),
  graph("Levi")
)

par(mfrow=c(3,3))
for (i in seq_along(solids)) {
  x = (i - 1) %/% 3 + 1
  y = (i - 1) %% 3 + 1
  plot(solids[[i]])
}

2. 创建特定图形

2.1 特定图形

igraph 还提供了许多 make_* 形式的函数,用于创建不同结构的图

例如,创建一个环形图

g <- make_ring(10)

星形图

make_star(10, mode = "out")

栅格图

g <- make_lattice(length = 5, dim = 2)

构建一棵二叉树

g <- make_tree(10, 2)

创建全连接图

g <- make_full_graph(5)

创建一个没有边的图

g <- make_empty_graph(10)

2.2 随机图形

igraph 中提供的 sample_* 函数,用于生成随机图形

伯努利随机图,n、m 分别代表节点和边的个数

g <- sample_gnm(n = 20, m = 20)

n、p 分别设置节点个数和每两个节点之间绘制边的概率

g <- sample_gnp(n = 20, p = 1/10)

3. graph_from_literal

graph_from_literal 可以方便的创建较小的图,以传递表达式的方式来创建图形。

表达式由节点名称和边运算符组成,- 表示无向的边, + 表示有向边。边可以是任意长度,即可以添加任意数量的 -,如果只包含 -,则创建无向图。

例如

graph_from_literal(A-B)
graph_from_literal( A-----B, C--D, E--F, G--H, I, J, K )

: 操作符用于定义节点集合,如果连接两个集合,则集合中的每个节点都会与另一个集合相连

graph_from_literal( A:B:C:D -- A:B:C:D )

添加箭头

graph_from_literal( A +-+ B +---+ C ++ D + E)

在有向图中,只有包含 + 的边才会绘制,例如

graph_from_literal( A +- B -- C )

如果节点的名称包含空格或其他特殊字符,需要添加引号

graph_from_literal( "my" +- "salary is " -+ "$100" )

4. 从数据中创建

4.1 使用数据框创建

可以使用 graph_from_data_frame(或 from_data_frame) 函数从一个或多个包含节点或边的数据框中创建 igraph 对象。

graph_from_data_frame(d, directed = TRUE, vertices = NULL)

from_data_frame(...)

根据 vertices 参数是否为 null,会有两种不同的操作模式。

如果 vertices = NULL,则数据框的前两列表示边列表,剩下的列表示边的属性。

如果 vertices 不为空,则必须是一个包含节点信息的数据框。第一列将作为节点的名称,显示在图中,其他列作为节点的属性,且只保留边列表 d 中包含这些节点的边

示例

# 定义节点
actors <- data.frame(
  name = c("Alice", "Bob", "Cecil", "David",
           "Esmeralda"),
  age = c(48, 33, 45, 34, 21),
  gender = c("F", "M", "F", "M", "F")
)
# 定义边
relations <- data.frame(
  from = c("Bob", "Cecil", "Cecil", "David",
           "David", "Esmeralda"),
  to = c("Alice", "Bob", "Alice", "Alice", "Bob", "Alice"),
  same.dept = c(FALSE, FALSE, TRUE, FALSE, FALSE, TRUE),
  friendship = c(4, 5, 5, 2, 1, 1),
  advice = c(4, 5, 5, 4, 2, 3)
)
# 将数据转换为 igraph 对象
g <- graph_from_data_frame(
  relations, directed = TRUE, 
  vertices = actors
)
plot(g)

as_data_frame 用于将 igraph 对象转换为一个或多个数据框。根据 what 参数来进行转换,可选的值为 c("edges", "vertices", "both")

> as_data_frame(g, what = "edges")
       from    to same.dept friendship advice
1       Bob Alice     FALSE          4      4
2     Cecil   Bob     FALSE          5      5
3     Cecil Alice      TRUE          5      5
4     David Alice     FALSE          2      4
5     David   Bob     FALSE          1      2
6 Esmeralda Alice      TRUE          1      3
> as_data_frame(g, what = "vertices")
               name age gender
Alice         Alice  48      F
Bob             Bob  33      M
Cecil         Cecil  45      F
David         David  34      M
Esmeralda Esmeralda  21      F

如果为 both,则会将节点和边以数据框列表的形式返回

4.2 使用边列表

graph_from_edgelist 用于从边列表来创建 igraph 对象,接受一个包含两列的矩阵,每行定义了一条边。

el <- matrix( c("foo", "bar", "bar", "foobar"), nc = 2, byrow = TRUE)
g <- graph_from_edgelist(el)

创建一个环形图

g <- graph_from_edgelist(cbind(1:10, c(2:10, 1)))

4.3 邻接矩阵

graph_from_adjacency_matrix 是一个灵活的函数,能够使用邻接矩阵来创建 igraph 对象

graph_from_adjacency_matrix(adjmatrix, mode = c("directed", "undirected",
  "max", "min", "upper", "lower", "plus"), weighted = NULL,
  diag = TRUE, add.colnames = NULL, add.rownames = NA)

节点的顺序将依照矩阵的顺序排序,mode 参数各个值的含义为:

  • directed:有向图
  • undirected:无向图,与 max 一样
  • max:将 max(A(i,j), A(j,i)) 作为无向图边的值
  • upper:使用上三角来构建无向图
  • lower:使用下三角来构建无向图
  • min:将 min(A(i,j), A(j,i)) 作为无向图边的值
  • plus:将 A(i,j)+A(j,i) 作为无向图边的值

如果 weighted 参数为 TRUE,会创建加权图

示例

adjm <- matrix(sample(0:1, 100, replace = TRUE, prob = c(0.9, 0.1)), nc = 10)
g1 <- graph_from_adjacency_matrix(adjm)
plot(g1)
g2 <- graph_from_adjacency_matrix(adjm, weighted=TRUE)

获取 igraph 对象节点的权重

> E(g2)$weight
[1] 1 1 1 1 1 1 1 1 1

设置行列名称

colnames(adjm) <- sample(letters, ncol(adjm))
rownames(adjm) <- seq(nrow(adjm))

g3 <- graph_from_adjacency_matrix(adjm, weighted=TRUE, add.rownames="code")
plot(g3)

4.4 图层

我们还可以使用类似 ggplot2 图层的方式,使用 + 来添加节点和边,例如

g <- make_empty_graph(directed = FALSE) + 
  vertices(LETTERS[1:10]) +
  edges('A','B', 'B','D', 'C','D', 'D','E', 'E','G', 'F','G', 'G','H', 'H','I', 'I','J')
plot(g)

我们首先使用 make_empty_graph 创建一个空的图,默认为有向图,设置 directed = FALSE 来绘制无向图

然后,使用 + 来添加 vertices() 创建的结点和 edges() 创建的边

还可以使用 - 来删除某些节点或者边,例如

g <- make_empty_graph(directed = FALSE) + 
  vertices(LETTERS[1:10]) +
  edges('A','B', 'B','D', 'C','D', 'D','E', 'E','G', 'F','G', 'G','H', 'H','I', 'I','J') -
  vertices(LETTERS[5]) -
  edges('A|B', 'I|J')
plot(g)

删除边的使用,传递给 edges() 的值略有不同,要删除的边为使用 | 连接两个节点名称的字符串形式

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,463评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,868评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,213评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,666评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,759评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,725评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,716评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,484评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,928评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,233评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,393评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,073评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,718评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,308评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,538评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,338评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,260评论 2 352

推荐阅读更多精彩内容