有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧!
由于本系列的所有分析代码均为师兄细心整理和详细注释而成的!欢迎点赞、收藏、转发!
您的支持是我持续更新的最大动力!
系列内容包括:
- 各种类型的热图你学会了吗?
- 普通热图
- 环形热图
- 解锁火山图真谛!
- plot函数就能画火山图?
- 高级函数绘制火山图--ggplot2、ggpurb
- 经典富集分析及气泡图、柱状图绘制
- 气泡图绘制
- 柱状图绘制
- 富集分析圈图
- 富集分析弦图
- 绘制一张可以打动审稿人的桑基图
- 生存分析 -- KM曲线图
- 基础PCA图
- 云雨图
- 韦恩图
- 环形互作网络图
- 相互作用网络图
- 聚类树美化
- 富集分析气泡图进阶版
- mantel test相关性图
- 词云图
- 瀑布图
- 森林图
- 曼哈顿图
- 哑铃图
- 三线表
- 嵌套圈图
- 列线图
- 蜂群图
- 箱线图+贝塞尔曲线
- 矩阵散点图
- 等等,想到再继续补充!!!
本期富集分析圈图效果展示
数据构建
############## 绘制桑基图 ######################
# 搞清楚需要的数据结构:
nodes = data.frame("name" =
c("Node A", # Node 0
"Node B", # Node 1
"Node C", # Node 2
"Node D"))# Node 3
links = as.data.frame(matrix(c(
0, 1, 10, # Each row represents a link. The first number
0, 2, 20, # represents the node being conntected from.
1, 3, 30, # the second number represents the node connected to.
2, 3, 40),# The third number is the value of the node
byrow = TRUE, ncol = 3))
names(links) = c("source", "target", "value")
# 查看构建的数据:
> head(nodes)
name
1 Node A
2 Node B
3 Node C
4 Node D
> head(links)
source target value
1 0 1 10
2 0 2 20
3 1 3 30
4 2 3 40
可以看到绘制桑基图,主要用到两个数据,一个是节点的名称信息 -- nodes;另一个是节点之间的链接信息 -- links;
第一个不用多说。第二个稍微解释一下,links数据框中应该包含三列:
- 其中第一列为source,即连接线的起始端;
- 第二列为target,表示连接线的末端,这里的0,1,2,3分别代表nodes信息中的1-4个节点,注意这里的节点索引是从0开始的,千万别搞混了哦!
- 第三列为value,表示连接线的宽度值,数值越大,发出的线条就会越宽!
绘图
library(networkD3)
sankeyNetwork(# 指定links和nodes信息:
Links = links,
Nodes = nodes,
# 指定source、target、value以及nodeID对应的列名;
Source = "source", Target = "target",
Value = "value", NodeID = "name",
# 设置字体和节点的宽度
fontSize= 12, nodeWidth = 30)
没错,就是这么简单,这样一个最简单的桑基图就出来啦!
使用自己的数据
############### 使用自己的数据 #############################
links <- read.csv("links.csv",header = T, fileEncoding = "UTF-8-BOM")
nodes <- read.csv("nodes.csv", header = F, fileEncoding = "UTF-8-BOM")
links$target <- links$target -1
colnames(nodes) <- "name"
sankeyNetwork(Links = links, Nodes = nodes,
# 指定source、target、value和name:
Source = "source",
Target = "target",
Value = "value",
NodeID = "name", # 节点的名字
# 调整配置:
fontSize = 12, # 节点的字体大小
nodeWidth = 30, # 节点的宽度
nodePadding = 8 # 节点之间的距离
)
最后,欣赏一波超多层节点的复杂桑基图吧!
######################### 复杂桑基图 ##############################
nodes <- read.csv("nodes1.csv",row.names = 1, header = T, fileEncoding = "UTF-8-BOM")
links <- read.csv("links1.csv",header = T, fileEncoding = "UTF-8-BOM")
# Plot
sankeyNetwork(Links = links, Nodes = nodes, Source = "source",
Target = "target", Value = "value", NodeID = "name",
units = "TWh", fontSize = 8, nodeWidth = 30)
往期优秀图形目录
以上内容仅为群内部分内容,不代表全部。详细目录请看下链接!
往期文章
1. 生信常用分析图形绘制01 -- 各种类型的热图
2. 生信常用分析图形绘制02 -- 解锁火山图真谛
3. [生信常用分析图形绘制03 -- 富集分析圈图