基本统计-描述性统计分析

对于一个连续型变量的描述性统计量有均值,标准差,中位值,最大值,最小值,值域等。对于类别型变量的描述性统计量有各个类别出现的频次。

summary()函数能够给出一个数据框的每一列变量的描述性统计量。

考虑airquality这个数据集,airquality是一个数据框,由6个变量组成,表示空气质量的不同侧面。


summary()函数给出了每个变量的最小值,四分位值,中位数,平均值,最大值。

psych包中的describe()函数也可以对数据框计算描述性统计量。


能够计算更多的描述性统计量。

有的时候我们不止希望得到所有样本的描述性统计量,还希望得到分组的描述性统计量。这里可以使用aggregate()函数。

aggregate(一个数据框或其中的变量,by=list(类别型变量),FUN=函数)


这就是按照am分类的mpg均值。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容