分析数据的第一件事,就是观察它。
mtcars数据集
mtcars数据集收集了32种不同汽车的11个变量。
问题1:我们想知道在这32种汽车中,不同气缸数量的汽车分别有多少种?
代码
于是我们知道了,有4个气缸的汽车有11种,6个气缸的汽车有7种,8个气缸的汽车有14种。用条形图来表示更直观一些。
> counts <- table(mtcars$cyl)
> barplot(counts,xlab="Number of cylinders",ylab="Numbers of cars")
简单条形图
问题2:不同引擎类型的汽车分别有几个气缸数?
> counts <- table(mtcars$cyl,mtcars$vs)
> barplot(counts,xlab="Engine (0 = V-shaped, 1 = straight)",ylab="Kinds",legend=T,beside=T) #如果beside=F,则画出的是堆叠条形图。
分组条形图
从图中,我们可以看出,V-shaped引擎的气缸数和straight引擎的气缸数的区别。
问题3:不同气缸数的汽车平均每加仑油能行驶多远?
> means <- aggregate(mtcars$mpg,by=list(mtcars$cyl),FUN=mean) #按照cyl这列的不同类别,对mpg分组,并分组求平均
> means <- means[order(means$x),] #根据平均值,从小到大排序
> barplot(means$x,names.arg=means$Group.1,main="Mean mpg",xlab="Number of cylinders")
平均值条形图
从图中,我们看出,气缸数越少,mpg越大,也就越省油。
问题4:不同引擎的汽车各自气缸数比例如何?(问题2的变形)
> counts <- table(mtcars$vs,mtcars$cyl)
> spine(counts)
spinogram
从图中可知两种不同引擎汽车的汽缸数占比。