R可视化—基于UpSetR包的数据集合可视化教程

“ 在展示数据集合的时候,随着集合数目的增多,使用Venn图进行数据集合可视化时,图形会变得很复杂,很难一眼获取关键信息。今天,给大家介绍一个基于R语言的的数据集合可视化包——UpSetR。下面就给大家展示如何使用UpSetR包一步步实现数据集合的展示!”

01 入门篇

首先,给大家介绍如何安装、导入UpSetR包,并基于这个包进行最简单的数据集合展示:

1、UpSetR包的安装与导入(R语言环境的安装与配置大家自行问度娘哈)
install.packages("UpSetR")#安装
#当然,也可以通过Github进行安装哈
# install.packages("devtools")
# devtools::install_github("hms-dbmi/UpSetR")
library(UpSetR)#导入
2、设置工作目录
#设置工作目录
setwd("D:\\桌面\\wzs\\R\\UpSetR)
#查看工作目录是否设置成功
getwd()
3、准备数据(这里使用随机编写的数据哈,大家也可以导入自己的数据)
#导入数据
df <- list(
        A = c(1, 2, 3, 4, 5, 6, 8, 12, 13), 
        B = c(1, 2, 4, 5, 7, 10), 
        C = c(1, 5, 6, 7, 8, 9, 10, 11, 13),
        D = c(1, 2, 5, 8, 10, 13))
# 查看数据
head(df)
4、使用upset()函数绘图:
1)绘图前,我们先看一下upset()函数包含的参数有哪些?
??UpSetR #查看UpSetR包的绘图函数及参数

upset(data, nsets = 5, nintersects = 40, sets = NULL,
  keep.order = F, set.metadata = NULL, intersections = NULL,
  matrix.color = "gray23", main.bar.color = "gray23",
  mainbar.y.label = "Intersection Size", mainbar.y.max = NULL,
  sets.bar.color = "gray23", sets.x.label = "Set Size",
  point.size = 2.2, line.size = 0.7, mb.ratio = c(0.7, 0.3),
  expression = NULL, att.pos = NULL, att.color = main.bar.color,
  order.by = c("freq", "degree"), decreasing = c(T, F),
  show.numbers = "yes", number.angles = 0, group.by = "degree",
  cutoff = NULL, queries = NULL, query.legend = "none",
  shade.color = "gray88", shade.alpha = 0.25, matrix.dot.alpha = 0.5,
  empty.intersections = NULL, color.pal = 1, boxplot.summary = NULL,
  attribute.plots = NULL, scale.intersections = "identity",
  scale.sets = "identity", text.scale = 1, set_size.angles = 0,
  set_size.show = FALSE, set_size.numbers_size = NULL,
  set_size.scale_max = NULL)

我们可以看到,这个函数包含的参数很多,其实绘图我们用到参数就几个,想要进一步了解大家可自行去官网查看。

2) 绘图
upset(fromList(df), order.by = "freq")
#fromList()是UpSetR包提供的数据格式化转换函数,主要接受List数据
#order.by是矩阵点图中交集的排序方式
image.png

02 进阶篇

上面给大家展示的是如何使用UpSetR绘制最基本的图形,下面给大家介绍一下如何进一步通过调整参数得到我们想要的个性化图形(由于作图需求,上面的简单数据不适用于给大家进行进一步地展示,所以我们换用这个包自带的示例数据):

df<- read.csv(system.file("extdata", "movies.csv", package = "UpSetR"), header = T, sep = ";")
upset(df, order.by = "freq")
image.png

下面就给大家展示如何通过控制参数得到一张漂亮的个性化图:

upset(df, 
      sets = c("Action", "Comedy", "Mystery", "Thriller",  "War"),#指定展示的集合
      nset = 5, #集合范围的限制
      nintersects = 12, #需要绘制的交集数目
      order.by = c('degree','freq'), decreasing = c(F, T),#排序
      mb.ratio = c(0.7, 0.3),#柱状图与矩阵点图之间的比例大小
      number.angles = 0,#柱子上方数字倾斜角度
      point.size = 1.8,#矩阵中圆圈的大小
      line.size = 1, #矩阵点图中点和线的大小
      shade.color = "red",#矩阵点图阴影的颜色
      mainbar.y.label = "Intersection size", #条形图的轴标签
      sets.x.label = "Set Size", #柱状图的轴标签
      main.bar.color = "#73BAD6", #柱状图柱子颜色
      sets.bar.color = "#3b7960",#条形图条形的颜色
      matrix.color = "#033250",#矩阵中交集点的颜色
      text.scale = c(1.3, 1.3, 1, 1, 1.2, 1),#文本大小设置,分别对应intersection size title,intersection size tick labels,set size title,set size tick labels,set names,numbers above bars
      keep.order = TRUE,#让集合按照 sets 参数中指定的出现的顺序排列
      queries = list(list(query = intersects, 
                          params = list("Thriller","Action"),
                          active = T,color="#EF4143")))#设置查询条件
image.png

这样我们就得到了一张个性化的用于展示数据集合的图形,之后我们可以将得到的图形保存成PDF,再导入到PS或者AI进行进一步地美化和调整。

上面展示的内容是基于R语言的实现的数据集合可视化,那么,对于很多对代码并不是很熟悉的“小白”来说,有什么更友好的方式得到这样一张UpSetR图呢?还真有,下面就给大家安利几个在线绘制网站:

1、Evenn (http://www.ehbio.com/test/venn/

2、ChiPlot (https://www.chiplot.online/

3、NGDC Cloud (https://ngdc.cncb.ac.cn/bit/visual

4、SangerBox (http://vip.sangerbox.com/

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343

推荐阅读更多精彩内容