对于一个连续型变量的描述性统计量有均值,标准差,中位值,最大值,最小值,值域等。对于类别型变量的描述性统计量有各个类别出现的频次。
summary()函数能够给出一个数据框的每一列变量的描述性统计量。
考虑airquality这个数据集,airquality是一个数据框,由6个变量组成,表示空气质量的不同侧面。
summary()函数给出了每个变量的最小值,四分位值,中位数,平均值,最大值。
psych包中的describe()函数也可以对数据框计算描述性统计量。
能够计算更多的描述性统计量。
有的时候我们不止希望得到所有样本的描述性统计量,还希望得到分组的描述性统计量。这里可以使用aggregate()函数。
aggregate(一个数据框或其中的变量,by=list(类别型变量),FUN=函数)
这就是按照am分类的mpg均值。