箱型图

1.安装加载显示中文包

install.packages("sysfonts")  
install.packages("showtext")  
library(showtext) # 渲染字体包
library(sysfonts) # 安装字体包
library(ggsci)#sci配色
library(reshape2)#融合数据
library(ggplot2)#绘图工具
library(openxlsx)#excel文件读取包

2.显示中文

showtext.auto(enable=T)#全局使用showtext渲染字体

3.数据读取处理

df<- read.csv("***.csv",header=TRUE, check.names=FALSE)
#header=T表示数据表中第一行是名称;
#check.names=F表示对名称不进行检测是否是数字(如果是数字系统默认进行排序)
数据读取
df<-melt(df,na.rm = T)
#对数据表进行统计重新排列;na.rm=T表示删除缺失值
按照列进行重新排列
colnames(df) <- c("***","***")
#对数据集行名进行重命名
行重命名

4.作图

p <- ggplot(data=数据集名,mapping=aes(x=***,y=***,color=***,······))+
#data:表示用于作图的数据;mapping:使用aes函数使数据与图层进行关联)
#aes()常见的映射选项包括
     #1.x和y用于指定x轴和y轴映射的变量
     #2.color:映射点或线的颜色
     #3.fill:映射填充区域的颜色
     #4.linetype:映射图形的线形(1=实线、2=虚线、3=点、4=点破折号、5=长破折号、6=双破折号)
     #5.size:点的尺寸和线的宽度
     #6.shape:映射点的形状
     #7.group:默认情况下ggplot2把所有观测点分为了一组。
     #如果需要把观测点按额外的离散变量进行分组处理, 必须修改默认的分组设置
p <- ggplot(data=df,mapping=aes(x=日期,y=地区))+
        geom_point()+
        geom_boxplot()
p <- ggplot(df)+
        geom_point(mapping=aes(x=日期,y=含量))+
       geom_boxplot(mapping=aes(x=日期,y=含量))

结果相同


结果相同
p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期))+
  geom_point()+
  geom_boxplot()
p1
p2<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期))+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期))
p2
在ggplot()中映射数据和在几何对象中效果相同
p1<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期),show.legend = F)+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期),show.legend = F)
p1
p2<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期))+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期))
p2
p3<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期))+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期),show.legend = F)
p3
p4<-ggplot(data = df)+
  geom_point(mapping = aes(x=日期,y=含量,color=日期),show.legend = F)+
  geom_boxplot(mapping = aes(x=日期,y=含量,color=日期))
p4
grid.arrange(p1, p2,p3,p4,ncol=2,nrow=2)
图一:标例全删;图二:标例全保留;图三:删除geom_boxplot表例;图四:删除geom_point标例
p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期))+
  geom_point(show.legend = F)+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=3)+
  stat_boxplot(geom = "errorbar",width=0.15)#添加误差线
p1
添加误差线和标记突出点
p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期))+
  geom_point(show.legend = F)+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=4)+
  stat_boxplot(geom = "errorbar",width=0.16)+#添加误差线
  labs(x="日期",y="含量",title = "浸出物含量")+
  theme_bw()+
  theme(panel.grid.major=element_line(colour=NA),
        panel.background = element_rect(fill = "transparent",colour = NA),
        plot.background = element_rect(fill = "transparent",colour = NA),
        panel.grid.minor = element_blank(),
        legend.position = c(0.88,0.75),
        legend.box.background = element_rect(color="black",linetype = "dashed"),
        text = element_text(family = "STXihei"),
        axis.title.x=element_text(vjust=1, size=18,face = "bold"),
        axis.title.y=element_text(vjust=1, size=18,face = "bold"),
        axis.text.x=element_text(vjust=1,size=14,face = "bold"),
        axis.text.y=element_text(vjust=1,size=14,face = "bold"),
        legend.key.size = unit(20, "pt"),
        legend.text=element_text(size=14),
        legend.title =element_text(size=14),
        plot.title = element_text(hjust = 0.5,size = 20))
p1
设置主题

利用ggpubr中的函数compare_means()进行差异显著性检验

compare_means(formula, data, method = "wilcox.test", paired = FALSE,
  group.by = NULL, ref.group = NULL, ...)


  formula:指定一个公式,公式形式为 x ~ group,其中,x 表示一个数值型变量,group 表示一个因子型变量,包含一个或多个水平。例如,一个示例公式为 formula = TP53 ~ cancer_group,表示在 cancer_group 对应的各水平间比较TP53的表达水平;也可以同时指定多个响应变量,如 formula = c(TP53, PTEN) ~ cancer_group。
  data:指定一个数据框(data.frame),数据框需包含formula中的变量。
  method:指定统计检验的方法。默认为“wilcox.test”,即Wilcoxon检验(非参数检验);也可指定其他统计方法:
  “t.test”,即T检验(参数检验)。“t.test”和“wilcox.test”用于两组样本间的比较。当超过两组时,将会执行两两比较(pairwise comparison)。
  “anova”(参数检验)或 “kruskal.test”(非参数检验),用于执行多组间的单因素方差分析。
  paired:指定一个逻辑变量,表示是否需要执行配对检验,仅适用于t.test 和wilcox.test。
  group.by:指定一个分组变量的字符名,用于在统计检验之前对数据进行分组。当存在group.by指定的变量时,均值比较将在不同水平的各个子集数据中执行。
  ref.group:指定一个组别的字符名,作为对照组(reference group)。如果指定,各个分组水平将与对照组水平进行比较。也可指定ref.group为“.all.”,表示每个分组水平将于所有分组水平(如base-mean)进行比较。
stat_compare_means(mapping = NULL, comparisons = NULL hide.ns = FALSE,
                   label = NULL,  label.x = NULL, label.y = NULL,  ...)

mapping:通过 aes() 设置绘图时的aesthetic

comparisons:指定一个列表(list),每个列表元素需为长度等于2的向量。向量的内容可以为X轴的两个组别名(字符型),也可以是两个感兴趣组的组别索引(整数值),表示采用指定的两个组别进行比较。

hide.ns:逻辑变量,如果设为TRUE,显示显著性水平时将隐藏 ns 字样,即组间差异不显著时不显示 ns 字样。

label:指定一个字符串,表示标签类型。可为:“p.signif”(显示显著性水平),“p.format”(显示格式化的P值)。

label.x, label.y:指定一个数值,表示显示标签的绝对坐标位置。

…:传递给函数compare_means()的参数,如method、paired、ref.group。
## # A tibble: 1 x 8
##     .y. group1 group2      p  p.adj p.format p.signif   method
##                       
## 1   len     OJ     VC 0.0645 0.0645    0.064       ns Wilcoxon

.y.:用于统计检验的数值变量

p:P值

p.adj:调整后的P值,调整P值的默认方法为p.adjust.method = “holm”

p.format: 格式化的P值

p.signif:显著性水平,即用不同数量的 * 表示显著性水平

method:用于组间比较的统计方法

显示P值的标签位置可以通过如下参数来调整:label.x, label.y, hjust 和vjust。

显示P值的标签默认为 compare_means() 返回值中的 method 和 p 的组合。也可以通过 aes() 函数指定为其他显示形式。例如

aes(label = ..p.format..) 或 aes(label = paste0(“p =”, ..p.format..))
表示只显示格式化的P值,而不显示method

aes(label = ..p.signif..)
表示仅显示显著性水平

aes(label = paste0(..method.., “\n”, “p =”, ..p.format..))
表示在method名和P值之间添加换行符(“\n”)

分组数量大于2个进行两两比较 需要在comparisions中指定两两比较的对象

comparisons <- list( c("0.5", "1"), c("1", "2"), c("0.5", "2") )

将多组中的每一组与“.all.”(如base-mean)比较。当检验结果显著时,可以得出结论:与所有组相比,xxx组的***的表达水平显著降低或显著升高。

stat_compare_means(含量~日期,data=df,  label = "p.signif", method = "t.test",
                  ref.group = ".all.",label.y=c(*,*,*,*))
+
  geom_hline(yintercept = mean(myeloma$DEPDC1), linetype = 2)#添加多组平均值虚线
p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期,shape=日期))+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=4)+
  geom_point(show.legend = F,size=2)+
  stat_boxplot(geom = "errorbar",width=0.16)+#添加误差线
  labs(x="日期",y="含量(%)",title = "浸出物含量")+
  theme_bw()+
  theme(panel.grid.major=element_line(colour=NA),
        panel.background = element_rect(fill = "transparent",colour = NA),
        plot.background = element_rect(fill = "transparent",colour = NA),
        panel.grid.minor = element_blank(),
        legend.position = c(0.88,0.75),
        legend.box.background = element_rect(color="black",linetype = "dashed"),
        text = element_text(family = "STXihei"),
        axis.title.x=element_text(vjust=1, size=18,face = "bold"),
        axis.title.y=element_text(vjust=1, size=18,face = "bold"),
        axis.text.x=element_text(vjust=1,size=14,face = "bold"),
        axis.text.y=element_text(vjust=1,size=14,face = "bold"),
        legend.key.size = unit(20, "pt"),
        legend.text=element_text(size=14),
        legend.title =element_text(size=14),
        plot.title = element_text(hjust = 0.5,size = 20))+
  geom_hline(yintercept = mean(df$含量), linetype = 2)+
  stat_compare_means(method = "anova",label.y = 38,show.legend = F) +
  stat_compare_means(aes(label = ..p.signif..), method = "t.test",ref.group = ".all.",label.y=c(33,33,28.5,29,31.5),show.legend=F)
p1           
与所有组相比,8月中旬浸出物含量显著降低
library(ggpubr)
df<- read.csv("不同日期箱型图.csv",header=TRUE, check.names=FALSE)
df<-melt(df,na.rm = T)
colnames(df) <- c("日期","含量")
p1<-ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期,shape=日期))+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=4)+
  geom_point(show.legend = F,size=2)+
  stat_boxplot(geom = "errorbar",width=0.16)+#添加误差线
  labs(x="日期",y="含量(%)",title = "浸出物含量")+
  theme_bw()+
  theme(panel.grid.major=element_line(colour=NA),
        panel.background = element_rect(fill = "transparent",colour = NA),
        plot.background = element_rect(fill = "transparent",colour = NA),
        panel.grid.minor = element_blank(),
        legend.position = c(0.88,0.75),
        legend.box.background = element_rect(color="black",linetype = "dashed"),
        text = element_text(family = "STXihei"),
        axis.title.x=element_text(vjust=1, size=18,face = "bold"),
        axis.title.y=element_text(vjust=1, size=18,face = "bold"),
        axis.text.x=element_text(vjust=1,size=14,face = "bold"),
        axis.text.y=element_text(vjust=1,size=14,face = "bold"),
        legend.key.size = unit(20, "pt"),
        legend.text=element_text(size=14),
        legend.title =element_text(size=14),
        plot.title = element_text(hjust = 0.5,size = 20))+
  geom_hline(yintercept = mean(df$含量), linetype = 2)+
  stat_compare_means(method = "anova",label.y = 38,show.legend = F) +
  stat_compare_means(aes(label = ..p.signif..), method = "t.test",ref.group = ".all.",label.y=c(33,33,28,29,31.5),show.legend=F)
p2 <- ggplot(data = df,mapping = aes(x=日期,y=含量,color=日期,shape=日期))+
  geom_boxplot(outlier.colour="red", outlier.shape=1, outlier.size=4)+
  geom_point(show.legend = F,size=2)+
  stat_boxplot(geom = "errorbar",width=0.16)+#添加误差线
  labs(x="日期",y="含量(%)",title = "浸出物含量")+
  theme_bw()+
  theme(panel.grid.major=element_line(colour=NA),
        panel.background = element_rect(fill = "transparent",colour = NA),
        plot.background = element_rect(fill = "transparent",colour = NA),
        panel.grid.minor = element_blank(),
        legend.position = c(0.88,0.75),
        legend.box.background = element_rect(color="black",linetype = "dashed"),
        text = element_text(family = "STXihei"),
        axis.title.x=element_text(vjust=1, size=18,face = "bold"),
        axis.title.y=element_text(vjust=1, size=18,face = "bold"),
        axis.text.x=element_text(vjust=1,size=14,face = "bold"),
        axis.text.y=element_text(vjust=1,size=14,face = "bold"),
        legend.key.size = unit(20, "pt"),
        legend.text=element_text(size=14),
        legend.title =element_text(size=14),
        plot.title = element_text(hjust = 0.5,size = 20))+
  geom_hline(yintercept = mean(df$含量), linetype = 2)+
  stat_compare_means(method = "anova",label.y = 38,show.legend = F) +
  stat_compare_means(aes(label = ..p.signif..), method = "t.test",ref.group = ".all.",label.y=c(33,33,28,29,31.5),show.legend=F)+
  annotate("text", x=2 , y=37 ,label="农大药园")+
  annotate("text", x= 4, y=35 ,label="农大药园" )+
  annotate("text", x= 5, y=37.5 ,label="农大药园" )
p1           
p2



mycomparision <- list(c("6月中旬","7月下旬"),c("7月下旬","8月中旬"),c("8月中旬","8月下旬"),c("8月下旬","9月上旬"))


grid.arrange(p1, p2,ncol=2)

添加注释信息
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352

推荐阅读更多精彩内容

  • 作者:taoyan链接:https://www.jianshu.com/p/b7274afff14f[https:...
    BINBINCC阅读 1,905评论 0 13
  • 部分示例数据如下 第一列是数值 第二列是处理一-第三列是处理二 最终出图如下 这里自动做统计检验的函数是 stat...
    小明的数据分析笔记本阅读 11,389评论 2 22
  • 在许多时候,我们需要将多张图表放在一起,当然我们可以用PS来处理,但是作为一个R的Master,怎么可能容忍这种事...
    果果哥哥BBQ阅读 13,944评论 2 41
  • 箱型图又称为盒须图或盒式图,是一种用来显示数据分散情况的统计图。 箱型图分为上边缘,上四分位数,下边缘,下四分位数...
    小橙子_43db阅读 636评论 0 0
  • 表情是什么,我认为表情就是表现出来的情绪。表情可以传达很多信息。高兴了当然就笑了,难过就哭了。两者是相互影响密不可...
    Persistenc_6aea阅读 124,726评论 2 7