绘制的图分为三种,条形图,折线图,散点图。
折线图
以本校的去年食堂数据为样例介绍
以本校食堂2016/09/19数据为例,对每位学生的卡余额和账户余额进行非线性回归
统计目的:拟合卡余额和账户余额之间的非线性回归关系
library(gcookbook)
library(ggplot2)
Account=dataset[,11]
card=dataset[,12]
Consumption=dataset[,13]
grade=dataset[,7]
#tgg=data.frame(grade,Account,card)
#ggplot(tgg,aes(x=factor(Account),y=card,group=grade))+geom_line(position = position_dodge(1.0),size=5)+geom_bar(fill='steelblue')
p=ggplot(data=dataset,aes(x=Account,y=card,colorur=factor(grade)))
p+geom_point()+geom_smooth()
绘图dataset Sample
ggplot2 Options:
data 为到输入的数据集模板,aes为自适应数据集模板,我们设当前所需要回归的数据样本集为Account,需要进行拟合的数据样本集为card
group代表离散型随机变量随grade样本变量进行回归
柱形图
绘制单变量的柱形图
一般来说,ggplot的柱形图默认统计方法(stat)是计数(count)的,但是大多时候,我们更习惯于使用统计完成的数据,因此,在相关的图形参数中必须要增加stat=“identity”这一项。
统计目的:统计2016/09/19食堂学生消费分布
library(ggplot2)
library(plotly)
Account=dataset[,12]
Consumption=dataset[,13]
grade=datasets[,17]
df=data.frame(y=grade,x=Account)#以年级为ylab,账户余额为xlab
ggplot(data=df,aes(grade,Account))+geom_bar(aes(fill=grade),stat = "identity",position = "dodge",width = 0.8)
+lab(title(main = '2016/09/19_Cosumption',xlab = 'grade',ylab ='Amout' ))
绘图dataset样例:
官方geom_bar函数定义如下:
data.frame或其他对象将覆盖绘图数据。所有对象将被加强以产生数据框
aes是一个绘制坐标范围的函数,这里用的两个参数Options仅对于单离散型随机变量而言,
代表设定axis所对应的变量
geom_bar(),绘图句柄函数
fill代表我们所需统计的单变量,从数据集中收集该变量分类后所代表的条形分布
position:这个参数令人头疼了三天,意义是更改条形图样式,常用的stack参数代表统一分类的数据呈数据栈一样分布,默认按升序入栈;dodge代表簇形分布图,使数据纵向排列,所有参数 见下图