一种ceRNA关系网络的新颖画法,R语言绘制冲击图(桑基图)教程

在ceRNA相关的研究中,例如circRNA-miRNA-mRNA,或者lncRNA-miRNA-mRNA的靶向关系图谱,一般通过网络图呈现。首先可以肯定的是,网络图是一种清晰展示ceRNA网络结构的有效方法。

文献中的ceRNA网络图示例

不过同一种类型的图见多了,多少会产生一些审美疲劳。那么,有没有其它的可替代方案呢?本篇则给大家带来一种别致的画风,使用冲击图(或桑基图)代替网络图描述ceRNA网络

例如文献“Construction and comprehensive analysis of a ceRNA network to reveal potential prognostic biomarkers for hepatocellular carcinoma”中描述lncRNA-miRNA-mRNA关系的ceRNA冲击图。

文献中的ceRNA冲击图

冲击图(alluvial)、桑基图(sankey),名称傻傻分不清倒也没关系,很多情况下可以当作一类来看待。如何,上图中3者间的结构是不是也很清晰?如果您也心动了,下面就让我们重现该文献的样式,绘制冲击图展示ceRNA关系。

在原文献附录中,作者提供了上图lncRNA-miRNA-mRNA靶向关系的原始数据,可以直接在原文中获取。为了方便大家操作,我们已经下载了数据做了本地整理,并和R代码等一起打包,可点击这里获取

示例文件

示例文件一共两个,“lncRNA_miRNA.txt”记录了lncRNA和miRNA的靶向关系,“miRNA_mRNA.txt”记录了miRNA和mRNA的靶向关系。

文献中的数据,lncRNA-miRNA和miRNA-mRNA靶向关系表

对应靶向关系

首先将示例数据读入到R中,由于lncRNA-miRNA-mRNA的关系是分两张表记录的,需要将它们整合到一起,做个关系对应。

#读取数据,两个靶向关系表
lncRNA_miRNA <- read.delim('lncRNA_miRNA.txt', sep = '\t', stringsAsFactors = FALSE)
miRNA_mRNA <- read.delim('miRNA_mRNA.txt', sep = '\t', stringsAsFactors = FALSE)

#整合靶向关系
ceRNA <- merge(lncRNA_miRNA, miRNA_mRNA, by = 'miRNA')
ceRNA$link <- 1
ceRNA <- reshape::melt(ceRNA, id = 'link')

variable <- summary(ceRNA$variable)
ceRNA$flow <- rep(1:variable[1], length(variable))

head(ceRNA)  #查看整理后的数据结构
整理后的lncRNA-miRNA-mRNA靶向关系表

整理后的结构中:

variable指明为lncRNA、miRNA还是mRNA;

value为具体的分子名称;

flow为关系流,如果某lncRNA、miRNA和mRNA位于同一条靶向路径中,则flow中的数值是一样的。

R包ggalluvial的冲击图(桑基图)绘制

文件结构整理完毕后,绘制冲击图。

R语言中,绘制冲击图的R包其实有很多可以选择。考虑到ggalluvial包是示例文献中使用的作图R包,并且它延伸自ggplot2,语法结构和ggplot2是一致的比较简单易学,因此我们也以ggalluvial包的方法绘制冲击图。

#预指定颜色,lncRNA、miRNA 和 mRNA 总计 36 种,需指定 36 种颜色
mycol <- c('#8DD3C7', '#FFFFB3', '#BEBADA', '#FB8072', '#80B1D3', '#FDB462',
    '#B3DE69', '#FCCDE5', '#BC80BD', '#CCEBC5', '#FFED6F', '#E41A1C', '#377EB8',
    '#4DAF4A', '#984EA3', '#FF7F00', '#FFFF33', '#A65628', '#F781BF', '#66C2A5', 
    '#6181BD', '#F34800', '#64A10E', '#FF00FF', '#c7475b', '#049a0b', '#BEAED4', 
    '#FDC086', '#FFFF99', '#386CB0', '#F0027F', '#4253ff', '#ff4308', '#D8D155',
    '#64495D', '#7CC767')

#ggalluvial 的冲击图
library(ggalluvial)

p <- ggplot(ceRNA, aes(x = variable, y = link,
    stratum = value, alluvium = flow, fill = value)) +
geom_stratum() +  #冲击图中的堆叠柱形图
geom_flow(aes.flow = 'forward') +  #冲击图连线绘制
scale_fill_manual(values = mycol) +  #颜色赋值
geom_text(stat = 'stratum', infer.label = TRUE, size = 2.5) +  #添加 lncRNA、miRNA 和 mRNA 标签
scale_x_discrete(limits = c('lncRNA', 'miRNA', 'mRNA')) +  #定义 lncRNA、miRNA 和 mRNA 列的展示顺序
labs(x = '', y = '') +  #去除 x 轴和 y 轴标题
theme(legend.position = 'none', panel.background = element_blank(),
    line = element_blank(), axis.text.y = element_blank())  #去除背景和图例

p
R语言仿制的原文章中的冲击图

这样,文献中描述lncRNA-miRNA-mRNA关系的ceRNA冲击图就重现出来了,样式是不是也很漂亮呢?

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 寻找ceRNA机制 构建关系网络 ceRNA机制是lnc/circRNA研究中最常见的机制之一,研究思路比较清晰,...
    纪伟讲测序阅读 1,404评论 0 2
  • 推荐指数: 6.0 书籍主旨关键词:特权、焦点、注意力、语言联想、情景联想 观点: 1.统计学现在叫数据分析,社会...
    Jenaral阅读 5,746评论 0 5
  • 昨天,在回家的路上,坐在车里悠哉悠哉地看着三毛的《撒哈拉沙漠的故事》,我被里面的内容深深吸引住了,尽管上学时...
    夜阑晓语阅读 3,826评论 2 9
  • 一月四号的大沙有个想法。从昨晚到现在就一直围绕在脑子里。或许深受那些小说的影响,或许真的就是我自己脑子或者精神么有...
    一個人的大沙阅读 4,082评论 3 4
  • 记梦 前记 他回国了,而事实上他其实从未来过。我不知道我们是如何交流的,但在梦里没有语言障碍。我时而是第三视角看着...
    江挽心阅读 709评论 0 0