写在前面
ggplot2是一款风靡全球的绘图R包,可惜的是,我对它的理解只能到入门的水平,本着在实战中学习的理念,我就搜索一下往后可能用得到的图,进行揣摩和优化,然后我发现了一个师兄的公众号,遂跟着这个师兄学习R绘图。公众号在文末。
1.读入数据
dat<-read.table("kegg.txt",
sep = "\t",
header = T)
colnames(dat)
2.过滤数据并用默认参数展示
library(tidyverse)
dat %>% filter(Corrected.P.Value<0.0001) -> dat01 #这里为了减少计算量,根据P值进行了过滤
dim(dat01)
dim(dat)
library(ggplot2)
dat01$GeneRatio<-dat01$Input.number/200 #ratio的大小其实反应着出现次数的多少
ggplot(dat01,aes(x=GeneRatio,y=Term))+
geom_point(aes(size=Input.number,color=Corrected.P.Value))
这当然无法达到我们发文章的要求,需要对其进行美化一下。
3. 美化
install.packages("paletteer")
library(paletteer)
#BiocManager::install("ggsci")
#library(ggsci)
#paletteer_c("ggthemes::Orange-Blue Diverging", 50)
ggplot(dat01,aes(x=GeneRatio,y=reorder(Term,GeneRatio))) +
geom_point(aes(size=Input.number,color=Corrected.P.Value))+
coord_cartesian(clip="off")+
scale_color_paletteer_c(palette = "grDevices::topo.colors",
name="p.adjust")+
theme_bw()+
scale_size_continuous(name="Count",
range = c(1,10))+
labs(y="Terms")
美化后的效果:
对上述几个参数进行解读:
- reorder: 根据出现的次数(generatio)对不同的通路从大到小进行排序。
- coord_cartesian() :调整画布大小,没什么好说的。
- scale_color_paletteer_c() :调用调色板paletteer,这里面有很多的调色板可以选用,拿grDevices来说,可以选用topo.colors()、rainbow()、heat.colors()、terrain.colors()、cm.colors();这里给自己挖了坑,能不能用ggsci来配色,目前没解决,等我解决了会来更正的。
- theme_bw() :调整网络的有无,也没什么好说的。
- scale_size_continuous() 添加图注,并标注大小范围。
参考链接:
1.绘图 https://mp.weixin.qq.com/s/n6TZoEADyDFcGzSzoGxlsg
2.paletteer documentation:https://www.rdocumentation.org/packages/paletteer/versions/1.4.0
3.grDevices documentation:https://astrostatistics.psu.edu/su07/R/html/grDevices/html/palettes.html
ggsci填坑系列
离散型变量系列:
ggplot(dat01,aes(x=GeneRatio,y=reorder(Term,GeneRatio))) +
geom_point(aes(size=as.factor(Input.number),color=as.factor(Corrected.P.Value)))+
coord_cartesian(clip="off")+
theme_bw()+
labs(y="Terms")+scale_color_aaas()
配色确实有那味了,但是没想到内置的颜色不够用,可能通路少一点会好。
连续型变量系列:
q <- ggplot(dat01,aes(x=GeneRatio,y=reorder(Term,GeneRatio))) +
geom_point(aes(size=Input.number,color=Corrected.P.Value))
q+scale_fill_aaas()
然后我发现,不管添不添加配色,都是和默认的配色保持一致,目前猜测可能是颜色不够导致的。
后记2
1.ggsci https://www.rdocumentation.org/packages/ggsci/versions/2.9
2.https://stackoverflow.com/questions/43359050/error-continuous-value-supplied-to-discrete-scale-in-default-data-set-example