分类数据分析

一、χ2统计量

χ2可以用来测定两个分类变量之间的相关程度。设分类的观测频数为fo,分类的期望频数为fe,则χ2统计量可以用下式表示:

二、拟合优度检验

拟合优度检验是用χ2统计量进行显著性检验的内容。它是依据总体分布状况,计算出分类变量各类别的期望频数,并于各类别的观察频数进行对比,判断是否有差异,从而达到对分类变量进行分析的目的。

三、独立性检验

拟合优度检验是对一个分类变量的检验,如果要判断两个分类变量相关性,需要利用列联表(contingency table)进行χ2统计量的独立性检验。

四、列联表中相关性度量

  • φ相关系数


  • c列联相关系数


  • V相关系数


五、χ2分布检验的注意事项

1)样本量必须足够大,每个单元中的期望频数不能过小。
2)如果只有两个单元,每个单元的期望频数必须是5或5以上
3)如果是两个单元格以上,其中有20%以上的单元格期望频数小于5,则不能使用χ2分布检验。可以考虑合并某些单元格。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1,中位数:按从小到大排列好的中间值 2,众数:出现次数最多的那个数 3,方差:数值和均值的距离的平方数的平均值 ...
    沈婷_bbf1阅读 5,532评论 1 2
  • 《R语言实战》笔记系列 本章学习大纲 1.描述性统计分析 2.频数表和列联表 3.相关系数和协方差 4.t检验 5...
    一日如十年阅读 1,552评论 0 1
  • 《深入浅出统计学》读书笔记 1、信息图形化 饼图 对不同组(或者类)所占的比例进行比较 条形图 对大小进行比较,但...
    haidaozheng阅读 5,610评论 0 6
  • 一、遇故旧之交,意气要愈新;处隐微之事,心迹宜愈显;待衰朽之人,恩礼当愈隆。 二、不责人小过,不发人阴私,不念人旧...
    阡歌紫陌阅读 264评论 2 2
  • 西风漫卷不止休,霜叶未语泪先流。 化作淅沥朦胧雨,漫江彩玉随波逐。 天边雾霭随风起,岭上顽石自悠悠。 多情自古空余...
    hi土豆先生阅读 615评论 0 17

友情链接更多精彩内容