ggplot2-几何对象和统计变换(3)

1、基本图形

#测试数据接上部分
library(ggplot2)
##geom_histogram
#geom_histogram(
#  stat = "bin",     #数据的统计方式:按窗口统计
#  binwidth = NULL,  #窗口大小
#  bins = NULL,      #分成多少个窗口
#  mapping = NULL,   #y轴是什么,数目..count.. ?密度..density..
#)
p1 <- ggplot(data = gene_len)
#第一种方法做直方图
p1+geom_histogram(stat = "bin",
                  bins = 100,
                  binwidth = 200,
                  aes(x = Length, y = ..count..))
#第二种方法
p1 + stat_bin(binwidth = 200,
              geom = "bar",
              aes(x=Length, y=..count..))

总结:统计变换和几何对象是ggplot绘图的两个侧面,缺一不可;
每种几何对象,默认对应一种统计变换;
每种统计变换,默认对应一个几何对象。
最简单的统计变换:不做任何统计变换(stat="identity")
最简单的几何对象:散点图、条形图、折线图
##################################################
基本图形类型:两个变量、不需要统计变换
geom_point:散点图
geom_bar:条形图
geom_line:折线图
geom_area:面积图
geom_polygon:多边形图
geom_text:添加标签
##################################################
位置调整参数:
stack 将图形元素堆叠起来
dodge 避免重叠,并排放置
fill 堆叠图形元素并将高度标准化为1
identity 不做任何调整
jitter 给点添加扰动避免重合
stat = "identity"表示不做任何统计变换
##################################################

#准备数据
library(gridExtra)
source("pre_data.R")
dexp_small <- filter(dexp, Gene %in% paste("G", 1:5, sep = ""))
#背景图层
p <- ggplot(data = dexp_small, aes(x = Sample, y = Expression))
#geom_point:散点图
p_point <- p + geom_point(
  stat = "identity",
  aes(color = Gene),
  position = "jitter") +
  labs(title = "geom_point")
#geom_bar:条形图
p_bar <- p+geom_bar(
  stat = "identity",
  aes(fill=Gene),
  position = "dodge") +
  labs(title = "geom_bar")
#geom_line:折线图
p_line <- p + geom_line(
  stat = "identity",
  aes(color=Gene, group = Gene)) +
  labs(title = "geom_line")
#geom_area
p_area <- p + geom_area(
  stat = "identity",
  aes(fill = Gene, group = Gene)) +
  labs(title = "geom_area")
#geom_text:添加标签
p_text <- p + geom_point(
  stat = "identity",
  aes(color=Gene)) +
  geom_text(
    stat = "identity",
    aes(label = round(Expression, digits = 1)),
# vjust垂直上调0.5    
    vjust = -0.5,
    check_overlap = T) +
  labs(title = "geom_text")
#图形整合起来
grid.arrange(p_point, p_bar, p_line, p_area, ncol =3)

2、单个变量的基本图形

示例 | 类型 | 统计变换 | 生成变量
Group |离散型 | stat_count| count, prop
Expression |连续型 | stat_bin | count, density
density = 占总体比例/宽度
第一步:统计变换
离散型变量 stat_count,直接计数
连续型变量 stat_bin,划分窗口再计数
第二步:绘制条形图
离散型变量 条形图 geom_bar
连续型变量 直方图 geom_histogram

连续型变量
dexp_small <- filter(dexp, Sample %in% paste("S", 1:3, sep = ""))

pc <- ggplot(data = dexp_small, aes(x =Expression))

#geom_histogram:直方图

pc_histogram <- pc + geom_histogram(
  stat = "bin",
  #bins = 30,
  binwidth = 100,
#修改500这个值为边界和中心
  #boundary = 500,
  #center = 500,
#左端的闭区间
  closed = "left",
  #aes(fill = Sample),
  position = "dodge"
) +
  labs(title = "geom_histogram")

#查看使用的窗口大小

pc_histogram_data <- ggplot_build(pc_histogram)$data[[1]]


#geom_freqpoly:频率多边形
pc_frepoly <- pc + geom_freqpoly(
  stat = "bin",
  aes(color = Sample)
) +
  labs(title = "geom_freqpoly")

#面积图:geom_area

pc_area <- pc + geom_area(
  stat = "bin",
  aes(fill=Sample),
  alpha=5/10,
  position = "dodge"
) +
  labs(title = "geom_area")
离散型变量
pd <- ggplot(data = group, aes(x = Group))

#条形图:geom_bar

pd_bar <- pd + geom_bar(
  stat = "count",
  aes(fill=Group)
) +
  labs(title = "geom_bar")


grid.arrange(pc_area, pc_frepoly, pc_histogram, pc_frepoly, ncol=2)

#密度图、箱线图、小提琴图

library(ggplot2)
library(gridExtra)
source("pre_data.R")

p <- ggplot(data = dexp)

##密度图

p_density <- p + geom_density(
  aes(Expression, color = Sample)
)

##箱线图

p_boxplot <- p + geom_boxplot(
  aes(x=Sample, y = Expression, color=Group)
)

#对于向量和矩阵,[]和[[]]基本上一样;
#但对于列表list,如[3],相当于提取列表中的第3个子表的整体,输出结果还是个列表list;而[[3]]相当于直接提取第3个子表中的所有元素,输出结果就是数列或字符串或向量等与其中元素类型一致的东西。
#实际中,对于列表,尽量采用[[]]直接提取其中的元素对象,不容易出错。

data_boxplot <- ggplot_build(p_boxplot)$data[[1]]


##小提琴图

p_violin <- p + geom_violin(
  aes(x=Sample, y = Expression, fill = Group)
)

grid.arrange(p_boxplot, p_density, p_violin, ncol=2)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,542评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,596评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,021评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,682评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,792评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,985评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,107评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,845评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,299评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,612评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,747评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,441评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,072评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,828评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,069评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,545评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,658评论 2 350

推荐阅读更多精彩内容

  • 使用一个工具,要先了解其设计逻辑.R graphics 像是画家一点一点画图,什么都要要自己设置。matplotl...
    柳叶刀刀阅读 1,508评论 0 10
  • 村里人一辈子被困在那个贫困的小山村,他们走不出去,也不想走出去,他们坦然接受病痛、离异婚变和死亡,并且他们认为理所...
    黄三顺阅读 1,230评论 4 9
  • 终是为了那花扇一段覆了寰宇天下,七月流火,往事谢后,不过是南柯一梦罢。玲珑社稷,功名千秋,傲视九天,鞠躬尽力,烽火...
    _断歌_阅读 379评论 0 3
  • 封建时期婚姻都是媒妁之言父母之命,万恶的包办婚姻拆散多少苦命鸳鸯。“五四运动”新思潮影响之下,进步青年开始想往自由...
    猜不中的尾声阅读 1,630评论 17 17
  • 2018.12.23 星期日 晴 (-5℃/-22℃) 刚开始提起笔写日记的时候,刚好赶上日更的活动,于是...
    留白简话阅读 801评论 0 66