统计学基础11- 基于正态总体的假设检验

一. 假设检验概述

1.1 假设

现有如下假设:
客户的地域信息会影响逾期率

如何证明上述论断是否正确?

统计学推断中罕见事件规则
在一个已知的假设下,如果一个待定事件发生的概率格外小,那么我们认为,这个假设可能不对。

实际推断原理:
概率很小的事件在一次试验中实际上几乎不会发生。

1.2 Gender Selection

下面是一个例子:


image.png

靠数据说话:


image.png

1.3 假设检验

假设就是对从总体参数(均值、比例等)的具体数值所作的陈述,比如,我认为配方一比配方二的效果要好。而假设检验就是先对总体的参数提出某种假设,然后利用样本的信息判断假设是否成立的过程,比如上面的假设信息我该接受还是拒绝。

1.4 显著性水平

显著性水平是一个概率值,原假设为真时,拒绝原假设的概率,表示为α,常取值为0.05、0.01、0.10。一个公司招聘,本来准备招聘100个人,公司希望只有5%的人是混水摸鱼招聘进来,所以可能会有5个人混进来,所谓显著性水平α,就是你允许有多少比例混水摸鱼的能通过测试。

1.5 零假设和备折假设

零假设:
用H0表示,一般是统计者想要拒绝的假设。零假设的设置一般为:等于=、大于等于>=、小于等于<=。

备折假设:
用H1表示,备则假设是统计者想要接受的假设。备择假设的设置一般为:不等于、大于>、小于<。

1.6 检验统计量

即计算检验的统计量。根据给定的显著性水平,查表得出相应的临界值。再将检验统计量的值与该显著性水平的临界值进行比较,得出是否拒绝原假设的结论。

1.7 P值

是一个概率值,如果原假设为真,p值是抽样分布中大于或小于样本统计量的概率。左检验时,p值为曲线上方小于等于检验统计量部分的面积。右检验时,p值为曲线上方大于等于检验统计量部分的面积。

1.8 假设检验的两种错误

类型 I 错误(弃真),如原假设为真,但否定它,则会犯类型 I 错误。犯类型 I 错误的概率为 α(即您为假设检验设置的显著性水平)。α 为 0.05 表明,当您否定原假设时,您愿意接受 5% 的犯错概率。为了降低此风险,必须使用较低的 α 值。但是,使用的α值越小,在差值确实存在时检测到实际差值的可能性也越小。类型 II 错误(采伪),如原假设为假,但无法否定它,则会犯类型 II 错误。犯类型 II 错误的概率为 β,β 依赖检验功效。可以通过确保检验具有足够大的功效来降低犯类型 II 错误所带来的风险。方法是确保样本数量足够大,以便在差值确实存在时检测到实际差值。

image.png

1.9 单双测检验

当假设关键词有不得少于/低于的时候用左侧检验,比如灯泡的使用寿命不得少于/低于700小时时;当假设关键词有不得多于/高于的时候用右侧检验,比如次品率不得多于/高于5%时。双侧检验指按分布两端计算显著性水平概率的检验,应用于理论上不能确定两个总体一个一定比另一个大或小的假设检验。一般假设检验写作H0:μ1=μ2。

image.png

二. 假设检验方法

假设检验方法:z检验,t检验,卡方检验

image.png

2.1 Z检验

2.1.1 Z检验 概述

Z检验原理:当总体标准差已知,样本量较大时用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。如果检验一个样本平均数与一个已知的总体平均数的差异是否显著,其Z值计算公式为:

image.png

如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著,其Z值计算公式为:
image.png

2.1.2 Z检验 实例

研究正常人与高血压患者胆固醇含量,比较两组血清胆固醇含量有无显著差异。

正常人组数据:n1=506(样本量) μ1=180.6(样本均值) s1=34.2(标准差)
高血压组数据:n2=142 μ2=223.6 s2=45.8

  1. 提出假设,规定适当检验统计量,确定检验水平:
    H0:μ1=μ2
    H1:μ1≠μ2
    α=0.05,样本量较大,且检验来自两组样本平均数的差异性,故选择z检验统计量

  2. 计算统计量z值
    将已知数据带入z检验公式,
    计算假设检验统计量 z=10.4
    α=0.05,双侧故 α/2=0.025,1-α=0.975 查表,确认临界值为1.96

  3. 确定p值,做出推断结论
    10.4(z值)>1.96(临界值),故p<0.05,按α=0.05水准拒绝H0,接受H1,可以认为正常人和高血压患者的血清胆固醇含量有差异。

2.2 t检验

2.2.1 t检验 概述

t检验:分为单样本的t检验、配对样本均数t检验(本篇不详细说)、两独立样本均数t检验。t检验应用于两组计量资料小样本比较,样本对总体有较好代表性,对比组间有较好组间均衡性,即随机抽样和随机分组。且样本来自正态分布总体。单个样本t检验适用于样本均数与已知总体均数μ0的比较,目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。应用于总体标准α未知的小样本资料,且服从正态分布。

单样本t检验实例:
某地新生儿出生体重为3.3kg,从该地难产儿中随机抽取35名婴儿,平均体重为3.42kg,标准差为0.4kg,问该地难产儿出生体重与新生儿体重是否不同?

  1. 提出假设,规定适当检验统计量,确定检验水平:
    H0:μ=μ0
    H1:μ≠μ0
    α=0.05 ,样本均数与已知总体均数μ0的比较,所以选择单样本t检验

  2. 计算统计量z值
    n=35 μ0=3.3 μ=3.42 s=0.4


    image.png

自由度=n-1=34,α=0.05,双侧故 α/2=0.025,1-α=0.975,自由度34,查表得出临界值为2.032

  1. 确定p值,做出推断结论
    因为1.77(z值)<2.032(临界值),故p>0.05,按α=0.05水平,差别无统计学意义,不拒绝h0,不能认为该地难产儿与新生儿体重有差异。

参考:

  1. http://www.dataguru.cn/article-4362-1.html
  2. https://blog.csdn.net/weixin_42327743/article/details/112568365
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353

推荐阅读更多精彩内容