19年高考已经落下帷幕,近期全国录取线也已经公布,估计各位靴子们陆陆续续也会收到高校寄来的录取通知书,金榜题名,岂不快哉。
2019年高考文科数学·全国Ⅰ卷有一道题,其实特别符合实际工作中使用,就是我们题目中见到的卡方检验,题目如下:
这道题考查的是【卡方独立性检验】,其实高中那会还记得这个些,但是工作以后又忘了,不过卡方检验在实际生活中还是有一席应用之地的
检验两个分类变量之间关联性
正确答案是这样的
这个题的第一问不用考虑,关键是第二问,它考查卡方检验的原理,需要计算卡方值,不过试题中给出了卡方值计算的公式,将这些数值直接带入公式进行计算即可得到卡方值=4.762。
获得卡方值对比发现卡方值大于3.841,
结论:有95%的把握认为男、女顾客对该商场的服务评价有显著差异。
这道题其实是简化了卡方检验的流程和步骤,我在一个公众号上看到了比较详细的解答方案,附在了后面,
强调:转载《自这道高考文科数学题你会做吗?》原创: ccccfys公众号:spss统计分析,如有侵权,请联系删除,感谢
卡方检验的标准步骤
对于这个试题的第二问,这里使用假设检验标准步骤来进行解答:
第一步:提出一对假设
H0:男、女顾客对该商场的服务评价没有差异
H1:男、女顾客对该商场的服务评价有显著差异
第二步:计算卡方统计量
得到:卡方值=4.762 。卡方值的计算可以如试题中给出的公式一样进行计算,还有另外一种计算方法,公式和计算过程如下:
第二种算法更加容易理解,实际频数就是样本数据的情况,期望频数是指:假设H0成立时,即假设男女之间满意的概率相同时计算出来的频数,本案例中,总共有100人,有70人满意,30人不满意,因此期望频数:男性 满意 = 50×0.7 = 35,50是男性总人数,0.7是总体满意的比例,其它的计算类似。最后得到的卡方值也是等于4.762。
如果上面表格中的O和E都是相等的,那么最终得到的卡方值就等于0,O和E都相等,那说明期望的和实际一样,也就是说如果卡方值等于0,男女之间满意的概率就是完全相同的。如果卡方值不等于0,卡方值越大,就说明男女之间满意的概率就相差越大,当卡方值超过一定的临界值后,就认为男女之间满意的概率存在显著差异。
第三步:将计算得到卡方值与置信度为95%的卡方临界值3.841进行比较
如果卡方值>3.841,就要拒绝H0,接受H1;否则就要接受H0.在这个题目中,因为K=4.762>3.841,因此要拒绝H0,接受H1,结论为:有95%的把握认为男、女顾客对该商场的服务评价有显著差异。
点评:高考试题给出的答案,没有交代这样的步骤,显得有些突兀。这样的三个步骤就清楚多了,但是这其中还涉及到卡方分布、卡方值计算公式,步骤里面也没有凸显出来,也就是说,还需要掌握卡方分布,才能真正理解这道题。我对高中教材已经很陌生了,不知道这道题是不是超纲了,知道的朋友可以留言。
使用SPSS快速得到卡方检验的结果
对于咋们这些经历过高考,甚至已经大学或者研究生毕业的人而言,就没必要再这样用公式,用笔算的形式去解题了,我们可以直接使用统计软件来解这道题。首先我们将数据录入到SPSS中:
然后使用人数变量对数据进行加权,操作是【数据】→【个案加权】,将【人数】选入【频率变量】,点击确定。
然后进行交叉分析,并输出卡方检验结果,操作是【分析】→【描述统计】→【交叉表】,然后按下图所示选择变量,并勾选【统计】里面的【卡方】,完成后点击确定。
下面是SPSS的输出结果:先给出了交叉表,然后给出了卡方检验的结果,计算得到的卡方值也是4.762,在SPSS中,要根据后面的【渐进显著性】取值来下结论,这个值如果小于0.05,就认为男、女顾客对该商场的服务评价有显著差异,此处这个值是0.029小于0.05,因此可以认为男、女顾客对该商场的服务评价有显著差异。
点评:此处给出的是假设检验的第二种下结论的方法,即【用P值做决策】,高考给出的参考答案是【用统计量临界值做决策】的结果。当然两种方法结论应该完全是一致的。