番外1. 卡方检验和二分变量假设检验的等效性

首先在自由度是1的时候呢,卡方值其实就是z值的平方。然后2x2的一个四格表的自由度是不是(2-1)*(2-1)=1呢?

所以照理说,能够做二分变量假设检验的,就可以做卡方,而对于2x2的交叉表,同样也可以用二分类变量假设检验去做。

比如说有一个硬币,我们认为抛硬币它应该是正面反面出现的概率各自都是0.5。但是现在我们抛了100次,正面出现62次,反面出现38次,这个时候如果做二分类变量假设检验,选择z=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}作为统计量,z>=1.96或小于等于-1.96的时候拒绝H0,接受备择假设。通过计算可得z值是2.4,拒绝H0。顺便一提z^2=5.76

这是经典的二分类变量统计检验了。但是现在我们玩玩花样,用卡方来搞搞。我们知道卡方值是这么算的:

\chi^2=\sum{\frac{(O_i-E_i)^2}{E_i}}

具体到我们这个问题O_1=62, O_2=38, E_1=50, E_2=50, 算出来以后卡方值不多不少,就是5.76

然后再看下面这个问题,治疗组和对照组,各有若干男女。其中治疗组男性50人,女性65人,对照组男性23人,女性38人。现在如果用卡方检验,一顿计算可以得出卡方值是0.547。那么这个问题可不可以用二分类变量的假设检验去做呢?毕竟现在自由度也是1呀,z^2=\chi^2

比如我们现在想评价男性和女性志愿者进入治疗组和对照组的概率是否均等,则有男性进入治疗组的概率是:\hat{p_1}=\frac{50}{73},女性进入治疗组的概率是\hat{p_2}=\frac{65}{103}, 顺便合并概率是p_{pooled}=\frac{115}{176},n1就是男性总数73,n2就是女性总数103。两组概率相比的假设检验用下面的式子计算:

z=\frac{\hat{p_1}-\hat{p_2}}{\sqrt{p_{pooled}(1-p_{pooled})(\frac{1}{n_1}+\frac{1}{n_2})}}

数据带进去一顿算可以求出来z是0.7398,这个东西平方你猜一下是多少?当然就是0.547了

AMAZING

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 白话“卡方检验” 什么是“卡方检验”? 卡方检验是假设检验的一种,用于分析两个类别变量的相关关系,是一种非参数假设...
    李威威阅读 11,814评论 2 49
  • 文|程瑞林(山东大学第二医院足踝外科)来源|(微信公众号)云中瑞麟(ID:ruilinfly) 瑞麟导读:对于计量...
    云中瑞麟阅读 146,556评论 10 69
  • CDA level I考试大纲 Part1 数据分析概念与统计学基础 占考试比例的30%; 共分5个知识方向,考试...
    嬛嬛非甄嬛阅读 1,869评论 1 2
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 8,837评论 0 3
  • 必须点个赞,太太太适合小白了,扫盲书哈~ 以讲故事的方式叙述,生动有趣,一百多页,一下就看完了。用碎片时间看的,就...
    爱理财的小C阅读 701评论 0 0