箱型图

1.安装加载显示中文包

install.packages("sysfonts")  
install.packages("showtext")  
library(showtext) # 渲染字体包
library(sysfonts) # 安装字体包
library(ggsci)#sci配色
library(reshape2)#融合数据
library(ggplot2)#绘图工具
library(openxlsx)#excel文件读取包

2.显示中文

showtext.auto(enable=T)#全局使用showtext渲染字体

3.数据读取处理

df<- read.csv("***.csv",header=TRUE, check.names=FALSE)
#header=T表示数据表中第一行是名称；
#check.names=F表示对名称不进行检测是否是数字（如果是数字系统默认进行排序）

数据读取

df<-melt(df,na.rm = T)
#对数据表进行统计重新排列；na.rm=T表示删除缺失值

按照列进行重新排列

colnames(df) <- c("***","***")
#对数据集行名进行重命名

行重命名

4.作图

p <- ggplot(data=数据集名,mapping=aes(x=***,y=***,color=***,······))+
#data:表示用于作图的数据；mapping:使用aes函数使数据与图层进行关联）
#aes()常见的映射选项包括
     #1.x和y用于指定x轴和y轴映射的变量
     #2.color：映射点或线的颜色
     #3.fill：映射填充区域的颜色
     #4.linetype：映射图形的线形（1=实线、2=虚线、3=点、4=点破折号、5=长破折号、6=双破折号）
     #5.size：点的尺寸和线的宽度
     #6.shape：映射点的形状
     #7.group：默认情况下ggplot2把所有观测点分为了一组。
     #如果需要把观测点按额外的离散变量进行分组处理, 必须修改默认的分组设置

p <- ggplot(data=df,mapping=aes(x=日期,y=地区))+
        geom_point()+
        geom_boxplot()
p <- ggplot(df)+
        geom_point(mapping=aes(x=日期,y=含量))+
       geom_boxplot(mapping=aes(x=日期,y=含量))

结果相同

p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期))+
  geom_point()+
  geom_boxplot()
p1
p2<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期))+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期))
p2

在ggplot()中映射数据和在几何对象中效果相同

p1<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期),show.legend = F)+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期),show.legend = F)
p1
p2<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期))+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期))
p2
p3<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期))+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期),show.legend = F)
p3
p4<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期),show.legend = F)+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期))
p4
grid.arrange(p1, p2,p3,p4,ncol=2,nrow=2)

图一：标例全删；图二：标例全保留；图三：删除geom_boxplot表例；图四：删除geom_point标例

p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期))+
  geom_point(show.legend = F)+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=3)+
  stat_boxplot(geom = "errorbar",width=0.15)#添加误差线
p1

添加误差线和标记突出点

p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期))+
  geom_point(show.legend = F)+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=4)+
  stat_boxplot(geom = "errorbar",width=0.16)+#添加误差线
  labs(x="日期",y="含量",title = "浸出物含量")+
  theme_bw()+
  theme(panel.grid.major=element_line(colour=NA),
        panel.background = element_rect(fill = "transparent",colour = NA),
        plot.background = element_rect(fill = "transparent",colour = NA),
        panel.grid.minor = element_blank(),
        legend.position = c(0.88,0.75),
        legend.box.background = element_rect(color="black",linetype = "dashed"),
        text = element_text(family = "STXihei"),
        axis.title.x=element_text(vjust=1, size=18,face = "bold"),
        axis.title.y=element_text(vjust=1, size=18,face = "bold"),
        axis.text.x=element_text(vjust=1,size=14,face = "bold"),
        axis.text.y=element_text(vjust=1,size=14,face = "bold"),
        legend.key.size = unit(20, "pt"),
        legend.text=element_text(size=14),
        legend.title =element_text(size=14),
        plot.title = element_text(hjust = 0.5,size = 20))
p1

设置主题

利用ggpubr中的函数compare_means()进行差异显著性检验

compare_means(formula, data, method = "wilcox.test", paired = FALSE,
  group.by = NULL, ref.group = NULL, ...)


  formula：指定一个公式，公式形式为 x ~ group，其中，x 表示一个数值型变量，group 表示一个因子型变量，包含一个或多个水平。例如，一个示例公式为 formula = TP53 ~ cancer_group，表示在 cancer_group 对应的各水平间比较TP53的表达水平；也可以同时指定多个响应变量，如 formula = c(TP53, PTEN) ~ cancer_group。
  data：指定一个数据框(data.frame)，数据框需包含formula中的变量。
  method：指定统计检验的方法。默认为“wilcox.test”，即Wilcoxon检验（非参数检验）；也可指定其他统计方法：
  “t.test”，即T检验（参数检验）。“t.test”和“wilcox.test”用于两组样本间的比较。当超过两组时，将会执行两两比较(pairwise comparison)。
  “anova”（参数检验）或 “kruskal.test”（非参数检验），用于执行多组间的单因素方差分析。
  paired：指定一个逻辑变量，表示是否需要执行配对检验，仅适用于t.test 和wilcox.test。
  group.by：指定一个分组变量的字符名，用于在统计检验之前对数据进行分组。当存在group.by指定的变量时，均值比较将在不同水平的各个子集数据中执行。
  ref.group：指定一个组别的字符名，作为对照组(reference group)。如果指定，各个分组水平将与对照组水平进行比较。也可指定ref.group为“.all.”，表示每个分组水平将于所有分组水平（如base-mean）进行比较。

stat_compare_means(mapping = NULL, comparisons = NULL hide.ns = FALSE,
                   label = NULL,  label.x = NULL, label.y = NULL,  ...)

mapping：通过 aes() 设置绘图时的aesthetic

comparisons：指定一个列表(list)，每个列表元素需为长度等于2的向量。向量的内容可以为X轴的两个组别名（字符型），也可以是两个感兴趣组的组别索引（整数值），表示采用指定的两个组别进行比较。

hide.ns：逻辑变量，如果设为TRUE，显示显著性水平时将隐藏 ns 字样，即组间差异不显著时不显示 ns 字样。

label：指定一个字符串，表示标签类型。可为：“p.signif”（显示显著性水平），“p.format”（显示格式化的P值）。

label.x, label.y：指定一个数值，表示显示标签的绝对坐标位置。

…：传递给函数compare_means()的参数，如method、paired、ref.group。

## # A tibble: 1 x 8
##     .y. group1 group2      p  p.adj p.format p.signif   method
##                       
## 1   len     OJ     VC 0.0645 0.0645    0.064       ns Wilcoxon

.y.：用于统计检验的数值变量

p：P值

p.adj：调整后的P值，调整P值的默认方法为p.adjust.method = “holm”

p.format: 格式化的P值

p.signif：显著性水平，即用不同数量的 * 表示显著性水平

method：用于组间比较的统计方法

显示P值的标签位置可以通过如下参数来调整：label.x, label.y, hjust 和vjust。

显示P值的标签默认为 compare_means() 返回值中的 method 和 p 的组合。也可以通过 aes() 函数指定为其他显示形式。例如

aes(label = ..p.format..) 或 aes(label = paste0(“p =”, ..p.format..))
表示只显示格式化的P值，而不显示method

aes(label = ..p.signif..)
表示仅显示显著性水平

aes(label = paste0(..method.., “\n”, “p =”, ..p.format..))
表示在method名和P值之间添加换行符(“\n”)

分组数量大于2个进行两两比较需要在comparisions中指定两两比较的对象

comparisons <- list( c("0.5", "1"), c("1", "2"), c("0.5", "2") )

将多组中的每一组与“.all.”（如base-mean）比较。当检验结果显著时，可以得出结论：与所有组相比，xxx组的***的表达水平显著降低或显著升高。

stat_compare_means(含量~日期,data=df,  label = "p.signif", method = "t.test",
                  ref.group = ".all.",label.y=c(*,*,*,*))
+
  geom_hline(yintercept = mean(myeloma$DEPDC1), linetype = 2)#添加多组平均值虚线

p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期,shape=日期))+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=4)+
  geom_point(show.legend = F,size=2)+
  stat_boxplot(geom = "errorbar",width=0.16)+#添加误差线
  labs(x="日期",y="含量(%)",title = "浸出物含量")+
  theme_bw()+
  theme(panel.grid.major=element_line(colour=NA),
        panel.background = element_rect(fill = "transparent",colour = NA),
        plot.background = element_rect(fill = "transparent",colour = NA),
        panel.grid.minor = element_blank(),
        legend.position = c(0.88,0.75),
        legend.box.background = element_rect(color="black",linetype = "dashed"),
        text = element_text(family = "STXihei"),
        axis.title.x=element_text(vjust=1, size=18,face = "bold"),
        axis.title.y=element_text(vjust=1, size=18,face = "bold"),
        axis.text.x=element_text(vjust=1,size=14,face = "bold"),
        axis.text.y=element_text(vjust=1,size=14,face = "bold"),
        legend.key.size = unit(20, "pt"),
        legend.text=element_text(size=14),
        legend.title =element_text(size=14),
        plot.title = element_text(hjust = 0.5,size = 20))+
  geom_hline(yintercept = mean(df$含量), linetype = 2)+
  stat_compare_means(method = "anova",label.y = 38,show.legend = F) +
  stat_compare_means(aes(label = ..p.signif..), method = "t.test",ref.group = ".all.",label.y=c(33,33,28.5,29,31.5),show.legend=F)
p1

与所有组相比，8月中旬浸出物含量显著降低

library(ggpubr)
df<- read.csv("不同日期箱型图.csv",header=TRUE, check.names=FALSE)
df<-melt(df,na.rm = T)
colnames(df) <- c("日期","含量")
p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期,shape=日期))+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=4)+
  geom_point(show.legend = F,size=2)+
  stat_boxplot(geom = "errorbar",width=0.16)+#添加误差线
  labs(x="日期",y="含量(%)",title = "浸出物含量")+
  theme_bw()+
  theme(panel.grid.major=element_line(colour=NA),
        panel.background = element_rect(fill = "transparent",colour = NA),
        plot.background = element_rect(fill = "transparent",colour = NA),
        panel.grid.minor = element_blank(),
        legend.position = c(0.88,0.75),
        legend.box.background = element_rect(color="black",linetype = "dashed"),
        text = element_text(family = "STXihei"),
        axis.title.x=element_text(vjust=1, size=18,face = "bold"),
        axis.title.y=element_text(vjust=1, size=18,face = "bold"),
        axis.text.x=element_text(vjust=1,size=14,face = "bold"),
        axis.text.y=element_text(vjust=1,size=14,face = "bold"),
        legend.key.size = unit(20, "pt"),
        legend.text=element_text(size=14),
        legend.title =element_text(size=14),
        plot.title = element_text(hjust = 0.5,size = 20))+
  geom_hline(yintercept = mean(df$含量), linetype = 2)+
  stat_compare_means(method = "anova",label.y = 38,show.legend = F) +
  stat_compare_means(aes(label = ..p.signif..), method = "t.test",ref.group = ".all.",label.y=c(33,33,28,29,31.5),show.legend=F)
p2 <- ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期,shape=日期))+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=4)+
  geom_point(show.legend = F,size=2)+
  stat_boxplot(geom = "errorbar",width=0.16)+#添加误差线
  labs(x="日期",y="含量(%)",title = "浸出物含量")+
  theme_bw()+
  theme(panel.grid.major=element_line(colour=NA),
        panel.background = element_rect(fill = "transparent",colour = NA),
        plot.background = element_rect(fill = "transparent",colour = NA),
        panel.grid.minor = element_blank(),
        legend.position = c(0.88,0.75),
        legend.box.background = element_rect(color="black",linetype = "dashed"),
        text = element_text(family = "STXihei"),
        axis.title.x=element_text(vjust=1, size=18,face = "bold"),
        axis.title.y=element_text(vjust=1, size=18,face = "bold"),
        axis.text.x=element_text(vjust=1,size=14,face = "bold"),
        axis.text.y=element_text(vjust=1,size=14,face = "bold"),
        legend.key.size = unit(20, "pt"),
        legend.text=element_text(size=14),
        legend.title =element_text(size=14),
        plot.title = element_text(hjust = 0.5,size = 20))+
  geom_hline(yintercept = mean(df$含量), linetype = 2)+
  stat_compare_means(method = "anova",label.y = 38,show.legend = F) +
  stat_compare_means(aes(label = ..p.signif..), method = "t.test",ref.group = ".all.",label.y=c(33,33,28,29,31.5),show.legend=F)+
  annotate("text", x=2 , y=37 ,label="农大药园")+
  annotate("text", x= 4, y=35 ,label="农大药园" )+
  annotate("text", x= 5, y=37.5 ,label="农大药园" )
p1           
p2



mycomparision <- list(c("6月中旬","7月下旬"),c("7月下旬","8月中旬"),c("8月中旬","8月下旬"),c("8月下旬","9月上旬"))


grid.arrange(p1, p2,ncol=2)

添加注释信息

最后编辑于：2021.05.25 13:06:52

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 220,295评论 6赞 512
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,928评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 166,682评论 0赞 357
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 59,209评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,237评论 6赞 397
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,965评论 1赞 308
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,586评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,487评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 46,016评论 1赞 319
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,136评论 3赞 340
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,271评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,948评论 5赞 347
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,619评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,139评论 0赞 23
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,252评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,598评论 3赞 375
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,267评论 2赞 358

箱型图

推荐阅读更多精彩内容