基本统计-频数表和列联表

频数表可以很好地展现类别型变量的分布。

使用vcd包中的Arthritis数据集。我们使用table()函数。


一维列联表

我们可以得知,女性有59人,男性有25人。


转换成比例

我们可以得知,女性占比70%,男性占比30%。


二维列联表

table()函数的第一个变量是行变量,第二个变量是列变量。


边际频数

margin.table()能够给出表格的边际和,1表示按行变量加和,2表示按列变量加和。


比例

1表示按行算比例,图中可知,安慰剂组的有16%的人有显著改善,治疗组有51%的人有显著改善。

2表示按列算比例,图中可知,显著改善的人中有25%是服用安慰剂,而75%的人受到了治疗。


直接在表格上添加边际和


三维列联表

用ftable()函数可以将其转换为一个紧凑的形式。


紧凑

chisq.test()函数可以对二维列联表的两个变量进行独立性检验。


卡方独立性检验

P值小于0.05,说明治疗方式和改善情况不独立。

fisher.test()函数也可以进行独立性检验。


fisher精确检验

得到了同样的结论。

另一个例子

HairEyeColor是R的内置数据集。它是一个三维列联表,记录了592个学生的头发眼睛颜色和性别。

我们现在想要知道,头发的颜色和眼睛的颜色这两个变量是否独立。


卡方独立性检验

先将这个三维列联表转换成头发和眼睛颜色的二维列联表。然后用chisq.test()函数计算。结果显示,眼睛和头发的颜色不独立,而且p值非常小。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 《R语言实战》笔记系列 本章学习大纲 1.描述性统计分析 2.频数表和列联表 3.相关系数和协方差 4.t检验 5...
    一日如十年阅读 1,342评论 0 1
  • 参考: R语言实战 因为书中列举的方法和知识点比较多,没必要全都掌握,会一种,其他的了解即可。我就简要地整理一下我...
    王诗翔阅读 3,469评论 2 11
  • 频数统计 mytable<-with(Arthritis, table(Improved)) #生成简单的统计表 ...
    肖玉贤阅读 1,663评论 0 0
  • 内蒙古自治区,简称“内蒙古”。自治区首府为呼和浩特,内蒙古横跨中国东北、华北、西北三大地区,接邻八个省区,是中国邻...
    我叫在水一方阅读 834评论 3 4
  • 她昨晚五点睡的,在社交软件上聊天。她玩社交App总是反反复复,卸了又下,下了又卸。她想要寻找些什么,却总是落寞而归...
    乐钗阅读 184评论 0 1