今天要学做的是一篇发表在《Nature》上的图片,用小提琴图展示基因表达变化,特点是小提琴图+箱线图+折线图,前两者比较容易实现,最后一个可能比较费劲,最后还是利用循环批量作图。这里我们提供两种做法。
图片来源
(Reference:Bian Z , Gong Y , Huang T , et al. Deciphering human macrophage development at single-cell resolution[J]. Nature, 2020, 582(7813):1-6.)
构建数据
数据类似于基因表达变化,这里我们利用了之前推文的数据(复现《nature communications》图表(二):一劳永逸,R语言一键画表达量箱线图并添加显著性)。
setwd("E:/生物信息学")
Exp <- read.csv("Exp.csv",header=T,row.names=1)#读入源文件
Exp <- log2(Exp+1) #因为是FPKM数据,标准化一下
#加载样本信息
info <- read.csv("info.csv",header=T)
Exp_plot<- Exp[info$Sample,]
Exp_plot$group=info$Type
Exp_plot$group <- factor(Exp_plot$group,levels=c("Asymptomatic","Mild","Severe","Critical"))
这是一篇长文,通过这个你可以学到:
1、最基本的就是ggplot绘制小提琴图,并结合箱线图。
2、计算基因在不同样本中的平均值。
3、折线图结合小提请图。
4、更加熟悉ggplot2各种参数。
5、附赠一组好看的颜色配色。
6、掌握for循环作图,照猫画虎,可应用到其他地方。
7、一种图形两种绘制方法。
8、如果你爱思考,或许能够将其中的细节开发到更多。
更多精彩内容请访问我的公众号《KS科研分享与服务》