商务与经济统计第9章

假设检验

1、原假设和备选假设的建立

原假设:在假设检验中,我们首先对总体参数做一个尝试性的假设  H_{0}

备选假设:定义另一个与院假设的内容完全对立的假设  H_{\alpha }

1)将研究中的假设设置为备选假设的情形

在很多应用中都涉及到要通过搜集证据来支持引入某些新方法或新功能会对现状有所改善的研究假设,此时可能将备选假设设置为研究者期望得到的结果。更具体地,假设工程师希望测试一个新开发的引擎能否实现燃油效率超过 24 英里/加仑,那么此时可以将两个假设设置为:

\bullet 零假设 Null hypothesis:H0: μ ≤ 24

\bullet 备选假设 Alternative hypothesis:Ha: μ > 24

如果通过抽样得到的燃油效率的均值 ≤ 24,那么此时就将无法拒绝零假设,也即新的设计并未改善燃油效率。反之,如果抽样得到的燃油效率的均值 > 24,那么此时可以拒绝零假设而选择支持备选假设。

2)将受到挑战的假设作为零假设

在很多其他的应用中,需要研究的对象是对总体的某个特征或参数的一个假定,此时,一般将这个假定设置为零假设。通过假设检验需要实现的是对于这个假定进行挑战,进而确认是否能够拒绝零假设而支持备选假设。更具体地,假设某个饮料的容量标示为 300 ml,此时假定其标示是正确的,即:

\bullet 零假设 Null hypothesis:H0: μ ≥ 300

\bullet 备选假设 Alternative hypothesis:Ha: μ < 300

如果经过抽样得出的结论支持零假设,则证明无需采取任何行动。否则,消费者可能会考虑起诉饮料公司。

而从公司经营的角度,如果饮料持续超标准容量罐装,则会产生额外的生产成本,因此,如果公司需要针对罐装容量做调查,则会希望罐装的均值保持在 300ml左右小范围波动,即此时的假设设定为:

零假设 Null hypothesis:H0= 300

备选假设 Alternative hypothesis:Ha≠ 300

从这个例子中可以看出,即便针对同一个研究对象,不同的出发点也会导致不同的假设形式,因此针对具体情景的假设设定就显得非常重要了。

3)、零假设和备选假设的一般形式

更一般地,如果令 μ0来代表事先主张的某个值,根据不同的假设设定,零假设和备选假设共有三种形式:

H0: μ ≥ μ0,HA: μ < μ0

H0: μ ≤ μ0,HA: μ > μ0

H0: μ = μ0,HA: μ ≠ μ0

值得注意的是,三种形式下相等的部分都发生在零假设下,且后续会知道前两种形式称为单尾检验,最后一种为双尾检验


2、第一类错误与第二类错误

理想情况下无论支持或否定零假设都是基于统计事实的正确决策,但实际情况是由于样本选取的不同,或者说由于抽样误差的存在,我们可能在零假设本身是正确的情况下选择了拒绝零假设,转而支持备选假设,当然也存在零假设原本应该被拒绝的情况下错误的选择了支持零假设,这两类错误分别称为 Type I 错误和 Type II 错误。I 类错误意味着错误的拒绝零假设 Type I error of rejecting H0,II 类错误意味着错误的接受零假设 Type II error of accepting H0。

显著性水平

当作为一个等式的原假设为真时,犯第一类错误的概率称为检验的显著性水平。(The level of significance is the probability of making a Type I error by rejecting H_{0} when the null hypothesis is true as an equality.)


3、总体标准差 σ 已知的总体均值的假设检验

再一次地,如果被研究对象的总体服从正态分布,那么以下假设检验的讨论计算结果都适用,而当总体不服从正态分布时,如果样本量足够大的情况下也同样适用。

单尾检验又分为以下两种形式:左尾检验 Lower tail test 和右尾检验 Upper tail test,后续我们会看到,之所以称左尾检验是在这个检验中,我们想要了解的是样本统计值是否落在某个设定的临界值/显著水平的左侧。同理,针对右尾检验,我们需要了解的是样本统计值是否落在某个设定的临界值/显著水平的右侧。

左尾检验 H0: μ ≥ \mu _{0} ,HA: μ < \mu _{0}

右尾检验 H0: μ ≤\mu _{0} ,HA: μ > \mu _{0}

举一个更加具体的例子,假设一家公司的产品标牌上注明的产品容量是 3 公斤,消费者权益保护机构也认同不可能每一罐产品的容量都丝毫不差的等于 3 公斤,但从保护消费者权益的角度只要确认总体的均值 μ ≥ 3 公斤即可,这里的 3 就是 \mu _{0} 。此时为了了解产品实际的填充情况,可以建立对“产品罐装质量大于等于 3 公斤”这个假设的一个检验如下:

H_{0} : μ ≥ 3

H_{\alpha } : μ < 3

在选定了假设检验的零假设和备选假设后,可以通过对产品进行抽样,假设抽样的产品数量为 36 罐,如果依据抽样的数据计算得到的 x̄ 的值小于 3 公斤,由于样本差异的存在,我们不能简单的直接拒绝零假设。调查者需要确认的是:到底 x̄ 小于 3 公斤的程度达到多少时,我们愿意承担犯第一类错误的风险而确定的宣称罐装重量的差异应该引起重视,或者进一步的采取惩罚行动。在这个决策当中,影响这个差异大小评价的一个重要因素就是显著水平的高低——也即调查者愿意承担的犯第一类错误的风险。

本例中调查人员愿意承担 1% 的犯第一类错误的风险来根据小于 3 公斤的样本统计值宣布对于这家公司进行处罚,也即 α = 0.01。

检验统计量 Test statistic 及其选择

继续上面的例子,在抽样完成后,如果假定由于对这家公司长期的监督中发现其总体的均方差 σ = 0.18,且灌装质量总体上服从正态分布,那么抽样得到的 x̄ 的抽样分布将服从均值为总体均值 μ,均方误差为 \sigma _{\bar{x} } = \frac{\sigma }{n^{1/2} } 的正态分布,在本例中 μ = \mu _{0} =3,\sigma _{\bar{x} } = 0.03。此时,我们可以通过计算标准值  z = (x̄ - μ) / \sigma _{\bar{x} } \来了解在服从前面这个抽样分布的前提下,抽样得到某个 x̄ 取值的概率。在后续可以知道,由于统计在检验中使用 z 这个统计值可以判定检验的结果,在这里 z 被称为检验统计量。

在获取了这个检验统计量以后,我们可以通过以下两种方法得到检验的结论:

p-value 法:

前面已经讲到,对于总体均值的左尾检验来说,在零假设中期望总体的均值应该是超过某个假设值的,但由于抽样误差的存在,我们可能会得到一个小于假设值的 x̄,此时必须要回答的一个问题就是,当这个 x̄ 与假设值左偏多少时,我们愿意承担一定的风险来拒绝零假设。

在已经获得 z 这个检验统计量后,可以根据标准正态分布表查取取得这个 z 值的概率,并将这个概率值称为 p-value。如果对应的 p-value 很小,则意味着在服从前述假设前提的概率分布的样本中取得这个 x̄ 的概率很小,这意味着零假设 H0这个前提很可能是有问题的。此时如果我们已经设定好了显著水平 α,即在零假设正确的前提下拒绝零假设的概率,并且发现 p-value 小于这个显著水平,那么我们可以更加确信的拒绝 H0。

回到这个具体的例子,假设我们得到的 x̄ = 2.92,则其 z = (2.92 - 3) / 0.03 = -2.67,对应标准正态分布中取得这个 z 值或比其更小的 z 值的概率为 0.0038,这意味这我们从一个均值为 3,均方误差为 0.03 的正态分布中取得 x̄ = 2.92 或更小值的概率为 P(x ≤ 2.92) = 0.0038。

前面由于已经知道管理者愿意承担的第一类错误的风险值为 α = 0.01,此时由于 p-value = 0.0038 远小于这个值,据此可以更加确定地拒绝零假设。

更一般地,在左尾检验中,如果在假设检验中得到的 p-value 小于等于显著水平 α,我们就可以拒绝零假设。由于 p-value 来自于对总体的一个观测,对于任意小于等于 α 的 p-value,我们都会拒绝零假设,因此 p-value 也被称为观测到得显著水平。

临界值法 :

临界值法要求我们为检验统计量设定一个临界值,对于左尾检验来说,如果检验统计量小于临界值,那么就可以拒绝零假设。如果理解了显著水平这个定义,由于其就是对应标准正态分布中 z 取得某个值左侧部分的概率值,这个值也就是这里的临界值,也即 α = P(z ≤ 临界值) 。

在临界值法进行左尾检验中,如果事先已经设定了显著水平,则可以根据标准正态分布表查取取得这个临界值及其左侧部分的概率为 α 时对应的 zα值,然后用这个值和检验统计得到的 zx̄进行对比,如果 zx̄≤ zα那么则可以拒绝零假设。

从上述计算过程可知,p-value 法和临界值法是基于同一个原理,也即在抽样中,符合一定条件的抽样分布服从正态分布,在此基础上 α 就是样本统计值取在某个临界点及其左侧区域内的概率值,此时:

\bullet 从样本统计得到的 zx̄值可以通过计算概率来和 α 做对比

\bullet 通过显著水平 α 计算临界值 zα来和 zx̄做对比

上面的讨论是针对左尾检验来说的,根据 p-value 的定义,在实际应用中有:

\bullet 左尾检验:考察的是总体的均值是否大于等于某个假设,p-value 的值等于取得某个 zx̄值为界限的正态分布曲线左侧部分的面积或者说概率,也即 p-value = P(z ≤ z_{\bar{x} } ),相应的拒绝零假设的条件是 p-value ≤ α 或 z_{\bar{x} } ≤  z_{\alpha  }

\bullet 右尾检验:考察的是总体的均值是否小于等于某个假设,p-value 的值等于取得某个 zx̄值为界限的正态分布曲线右侧部分的面积或者说概率,也即 p-value = 1 - P(z ≤ z_{\bar{x} } ),相应的拒绝零假设的条件是 p-value ≤ α 或 z_{\bar{x} } z_{\alpha  }

双尾检验

多时候我们需要被研究对象的某个特征固定在某个假设的取值附近,既不能太大,也不能太小。此时如果采用抽样的形式对于总体的特征参数进行研究时,有的样本的均值的取值会大于这个假设的取值,有的样本的均值的取值会小于这个假设的取值,也即抽样得到的均值的取值围绕设定值左右波动,那么如何有依据的评价这个波动的大小进而拒绝这个假设还是不拒绝这个假设就需要采用双尾检验。其零假设和备选假设的一般形式为:

H_{0} : μ = \mu _{0} H_{\alpha } : μ ≠ \mu _{0}

再一次地,这个评价的依据就是选择好的显著性水平 α,只不过与单尾检验最重要的区别在于,α 对应的概率值被平均分配为正态分布的左右两侧 z_{\alpha /2} 面积下的概率,其目的是考察抽样统计值围绕事先设定的假设值的左右偏离程度。相应的 p-value 也是取得检验统计值及其相反数的正态分布两侧的概率,并且当 P(z ≥ z_{\bar{x} } ) + P(z ≤ -z_{\bar{x} } ) ≤ α 时拒绝零假设,或者当采用临界值法时样本统计值 z ≥ z_{\alpha /2} 或 z ≤ -z_{\alpha /2} 可以认为在服从前述假设分布的情况下取得这个 z 值是小概率事件,也可以拒绝零假设。

至此,对于总体均方差已知的情况下对于总体均值的假设检验的讨论就结束了,总结前面的内容如下:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,137评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,824评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,465评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,131评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,140评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,895评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,535评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,435评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,952评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,081评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,210评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,896评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,552评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,089评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,198评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,531评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,209评论 2 357

推荐阅读更多精彩内容

  • 通常在研究中,我们会对已有的一些结论或者主张抱有合理的质疑 reasonable doubt,此时该如何通过概率统...
    拓季阅读 11,535评论 1 17
  • 《深入浅出统计学》读书笔记 1、信息图形化 饼图 对不同组(或者类)所占的比例进行比较 条形图 对大小进行比较,但...
    haidaozheng阅读 4,961评论 0 6
  • 用stata算集中指数采用Stata系统自带数据库auto.dta。 一、集中趋势的统计描述以变量price为例进...
    古洞洞阅读 5,992评论 1 3
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 8,696评论 0 3
  • 假设检验也叫显著性检验,是以小概率反证法的逻辑推理,判断假设是否成立的统计方法,它首先假设样本对应的总体参数(或分...
    井底蛙蛙呱呱呱阅读 120,108评论 4 41