第九章 假设检验

参考书目为安德森的《商务与经济统计》,以下为个人的学习总结,如果有错误欢迎指正。有需要本书pdf的,链接在本文末尾。(仅限个人学习使用,请勿牟利)

第九章 假设检验

假设检验中,我们首先对总体参数做一个尝试性地假设,称为原假设,记作H_0;定义另一个和原假设对立地假设,称为备择假设,记作H_a

9.1 原假设和备择假设的建立

9.1.1 将研究中地假设作为备择假设

例如测试新型燃油系统的燃油效率是否更好,原效率均值24英里/加仑,令新的燃油效率为\mu
我们希望得到的结论为H_a,新型的效率更高。
H_0:\mu\leq 24
H_a:\mu > 24

如果样本拒绝H_0的结论,那么就可以作出H_a的推断。

9.1.2 将收到挑战的假说作为原假设

如检测饮料净含量是否达标,比如一瓶标注67.6盎司的饮料。
H_0:\mu\geq 67.6
H_a:\mu <67.6
我们将受到挑战的假说(质量达标)作为原假设H_0,如果样本不能拒绝原假设,我们则认为商家的产品是达标的。

9.1.3 原假设和备择假设形式的小结

对于总体均值的假设检验,我们令\mu_0为假定值,并采用下面三种形式之一进行假设检验。

image

前两种是单侧检验,第三种是双侧检验。

9.2 第一类错误和第二类错误

image

简单来说,

  • 如果选择接受H_0是错误的,为第二类错误
  • 如果选择拒绝H_a是错误的,为第一类错误

在原假设为等式形式出现时,如\mu=24,犯第一类错误的概率称为检验的显著水平

显著水平:当作为一个等式的原假设为真时,反第一类错误的概率称为检验的显著水平。用\alpha来表示,一般取0.05或0.01。

应用中:只空值第一类错误的假设检验称为显著性检验(一般也是用这种类型的检)。
由于显著性检验中第二类错误的发生具有不确定性,所以我们只能说不能拒绝H_0,而不说接受H_0。因为接受了可能犯第二类错误。

9.3 总体均值的检验:\sigma已知

当总体不服从正态分布时得样本足够大,下面的方法才奏效。

9.3.1 单侧检验

总体均值的单侧检验有以下两种形式:

  • 下侧检验:H_0:\mu \geq \mu_0 H_a:\mu <\mu_0
  • 上侧检验:H_0:\mu \leq \mu_0 H_a:\mu >\mu_0

举例:咖啡每听3磅重
假设:H_0:\mu \geq 3 H_a:\mu <3
只要拒绝了H_0就可以处罚制造商,如果不能拒绝那就不惩罚。
我们选取36听作为样本,且总体标准差\sigma=0.18,且样本和总体都服从正态分布。
\sigma_{\bar x}=\frac{\sigma}{\sqrt{n}}=0.03
由于\bar x服从正态分布,则z=\frac{\bar x-\mu_0}{\sigma_{\bar x}}=\frac{\bar x-3}{0.03}

image

总体均值假设检验的检验统计量:\sigma已知
z=\frac{\bar x-\mu_0}{\sigma / \sqrt{n}}

当z值达到多小我们才能拒绝H_0,两种方法来解决
第一种:P-值法
P-值是一个概率值,它度量样本所提供的证据对原假设的支持程度。P-值越小说明反对原假设的证据越多。

例如刚刚的咖啡例子:z=\frac{\bar x-\mu_0}{\sigma / \sqrt{n}}=\frac{2.92-3}{0.18/ \sqrt{36}}=-2.67
我们根据标准正态概率表查的z=-2.67下侧的面积为0.0038。则P-值为0.0038(也称为实际显著水平)

image

由于P-值为0.0038小于0.01的显著水平,我们容许有0.001概率发生第一类错误的可能性拒绝H_0的成立。

P-值法的拒绝法则:如果p-值\leq \alpha,则拒绝H_0

第二种:临界值法
临界值是确定检验统计量的值是否小到足以拒绝原假设的一个基准。换句话,临界值是使我们拒绝原假设的检验统计量的最大值。

下侧检验的拒绝法则:临界值法
如果z\leq -z_{\alpha},则拒绝H_0

例子:咖啡(书上可能写错,根据查表z应该是-2.33)
临界值时标准正态概率分布中,下侧面积\alpha =0.01相对应的检验统计量的值。利用查表法,我们发现z=-2.23时下侧面积为0.01。\bar x=2.92对应z=-2.67 <-2.23则我们拒绝H_0

小结
p-值法相较于临界值法,优点在于可以知道有多么显著(实际显著水平)
单侧检验的p-值:

  1. 计算出检验统计量的值
  2. 下侧检验,根据标准正态分布,计算z小于或等于检验统计量的值的概率(下侧面积)。
  3. 上侧检验:根据标准正态分布,计算z大于或等于检验统计量的值的概率(上侧面积)。

可以根据excel的函数快速进行p和z的转化:

  • z到p:NORM.DIST()
  • p到z:NORM.INV()

9.3.2 双侧检验

双侧检验的一般形式:H_0:\mu=\mu_0 H_a:\mu \neq \mu_0

举例:高尔夫球的发球距离必须为295码,多了或少了都不行。
假设:H_0:\mu=295 H_a:\mu \neq 295
如果\bar x没有明显偏离295则不会拒绝H_0
选择\alpha=0.05作为检验的显著性水平,样本量为50,\sigma_{\bar x}=\frac{\sigma}{\sqrt{n}}=\frac{12}{\sqrt{50}}=1.7,\bar x=297.6

p-值法
如果检验统计量的值位于抽样分布的两侧尾部,则支持拒绝原假设。
上述高尔夫例子:z=\frac{\bar x-\mu_0}{\sigma / \sqrt{n}}=\frac{297.6-295}{12/ \sqrt{50}}=1.53
p(z\geq 1.53)=0.063 p-值=2\times 0.063=0.1260
由于p-值=0.1260>0.05,所以不能拒绝H_0

双侧检验p-值得计算步骤

  1. 计算检验统计量的值z
  2. 判断z的正负号,为正则求z大于或者等于检验统计量值得概率(上侧面积);为负同理。
  3. 将概率乘以2求得p-值

临界值法
例如取显著水平\alpha=0.05,左右两侧得临界值对应得面积就为\alpha /2=0.025根据查表法,求得检验统计量的临界值-z_{0.025}=-1.96 z_{0.025}=1.96
z\leq -1.96或者z\geq 1.96则拒绝H_0

image

9.3.3 小结和建议

截屏2020-12-19 18.02.03
image

9.3.4 区间估计与假设检验的关系

区间估计所构造的区间有100(1-\alpha)%概率包含总体均值,

image

置信区间和假设检验,都是观察样本统计量在抽样分布中的位置:

  • 区间估计,只要样本统计量在抽样分布所要求的范围内,就可以擅长手臂构造置信区间包含总体参数
  • 假设检验中\mu_0相当于总体参数,只要我们以这个参数作为总体均值,就可以构造一个抽样分布,同样的样本统计量伸长手臂构造的置信区间如果包含了\mu_0就不能拒绝H_0

9.4 总体均值的检验:\sigma未知

针对\sigma未知的情况,检验统计量服从自由度为n-1的t分布。
总体均值假设检验的检验统计量:\sigma未知
t=\frac{\bar x-\mu_0}{s/\sqrt{n}}

第八章讲了t分布是在假设抽样总体服从正态分布下得到的,当然如果样本容量n足够大也可以用。

9.4.1 单侧检验

例子:给希斯罗机场评分,n为60,评分从0-10分,\bar x=7.25分,样本标准差s=1.052,因为高于7认定机场提供了优质服务,所以假设如下:
H_0:\mu \leq 7 H_a:\mu >7
我们取显著性水平\alpha=0.05
t=\frac{\bar x-\mu_0}{s/\sqrt{n}}=\frac{7.25-7}{1.052/\sqrt{60}}=1.84
根据查询t分布表,查得自由度59,t=1.84的情况下p-值为

image

p-值介于0.05和0.025之间,小于0.05。所以我们拒绝H_0,认为这个机场

使用excel来对t和p进行转换:

  • t转p:T.DIST(x,deg_freedom,True)x填写t的值,最后返回累计下侧面积
  • p转t:T.INV(probability,deg_freedom)填写下侧面积,返回对应的t值

同样可以使用临界值法:
在自由度为59的t分布中上侧面积\alpha=0.05对应的临界值为t_{\alpha /2}=1.671只要t\geq1.671我们就可以拒绝H_0

9.4.2 双侧检验

举例:玩具生产商有近千家分销零售商,预计每个分销零售商需要的订货量为40个玩具,现抽样25个商家,令\mu表示订货量的总体均值,做出假设(定置信水平\alpha=0.05):
H_0:\mu =40 H_a:\mu \neq 40
如果我们不能拒绝H_0那我们就认为总体需求的均值为40(虽然可能犯二类错误)
样本均值\bar x=37.4 \mu_0=40 s=11.79 n=25
检验统计量的值:t=\frac{\bar x-\mu_0}{s/ \sqrt{n}}=\frac{37.4-40}{11.79/\sqrt{25}}=-1.10

image

根据查表,可以知道t=-1.10的下侧面积介于0.1-0.2之间。不过我用excel算出了准确的下侧面积为0.14,那么p-值=2 \times 0.14=0.28>\alpha=0.05 所以我们不能拒绝H_0,只能选择先接受(可能犯第二类错误)

当然也可以用临界值法
先求检验统计量的临界值-t_{0.025}=-2.06(书上是-2.604有点离谱,我还是以excel为准)
则用计算出来的检验统计量t值来比较,如果在-2.06-2.06之间,我们不能拒绝H_0

9.4.3 小结和应用建议

image

和有\sigma相比,没有的话用s来代替,检验统计量需要服从t分布。
如果总体是正态分布,小样本(n<15)也可以有满意结果,总体不服从正态分布,一般n\geq 30也可以有满意结果。

9.5 总体比率

我们令p_0代表总体比率的假设值,下面是关于总体比率的假设检验的三种形式:

image

分别为下侧检验,上侧检验,双侧检验

举例:高尔夫球场,女性少p_0=20%。经过运营后,看下是否上升。
假设:H_0:p\leq 0.20 H_a:p>0.20 如果能拒绝H_0就可以支持女性占比上升的结论。取显著水平\alpha=0.05

前面提到过,np\geq 5n(1-p)\geq 5,则\bar p服从正态分布。
\sigma_{\bar p}=\sqrt{\frac{p_0(1-p_0)}{n}} z=\frac{\bar p-p_0}{\sigma_{\bar p}}

总体比率假设检验的检验统计量
z=\frac{\bar p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}

回到刚刚的例子,我们选取样本n=400,其中100个为女性,则\bar p=0.25
检验统计量z=\frac{\bar p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}=\frac{0.25-0.20}{\sqrt{\frac{0.2(1-0.2)}{400}}}=\frac{0.05}{0.02}=2.50

我们将z转换为p(此时为下侧面积),根据查表此时下侧面积=0.9938,那么对应的上侧面积p-值=1-0.9938=0.0062<0.05,则我们可以拒绝H_0认为女性上升了。

也可以用临界值法
我们求出z_{\alpha}=z_{0.05}=-1.645,由于计算出来的z=2.50>1.645所以我们认为可以拒绝H_0

9.5.1 小结

和总体均值的检验一样,不过需要np\geq 5n(1-p)\geq 5,这样\bar p才符合正态分布。

image

9.6 假设检验与决策

我们知道:

  • 第一类错误是拒绝了H_0,但H_0为真。(通过置信水平\alpha来控制)
  • 第二类错误是接受了H_0,但H_0为假。

对于决策者来说,总是需要做出决策,哪怕不能拒绝H_0。所以后续的章节我们会讨论如何控制第二类错误。

9.7 计算第二类错误的概率

举例:测试电池寿命,我们假设H_0:\mu\geq 120 H_a<120,要求显著水平\alpha=0.05
已知n=36,\sigma=12,我们使用临界值法z_{0.05}=1.645
则看检验统计量是否满足不等式z=\frac{\bar x-120}{12/ \sqrt{36}}\leq -1.645
满足,则拒绝H_0,我们对不等式进行处理\bar x\leq120-1.645\left(\frac{12}{\sqrt{36}}\right)=116.71相当于

  • \bar x小于116.71时我们就会拒绝H_0
  • \bar x大于116.7我们会选择接受H_0(可能犯第二类错误)

为了计算第二类错误的发生概率,我们需要选择一个小于120小时的\mu值,比如选取\mu=112,我们可能从这批均值为112的货物中选出了\bar x=116.71的样本

image

我们计算当\mu=112时的检验统计量z=\frac{\bar x-\mu}{\sigma/ \sqrt{n}}=\frac{116.71-112}{12/\sqrt{36}}=2.36
我们可以知道z=2.36的上侧面积为0.0091,这就是当\mu=112时发生第二类错误的概率0.0091,这个概率用\beta

对于其他小于120的\mu值,我们可以重复计算该过程,求出不同\mu值下犯第二类错误的概率。

image

H_0为假,我们作出拒绝H_0的正确结论的概率称作检验的功效(power),根据不同的\mu对应的功效(1-\beta),我们可以绘制曲线称作为功效曲线。

image

总结计算第二类错误的概率流程:

  1. 确定假设H_0H_a
  2. 在显著水平\alpha下,得到z的临界值
  3. 并根据求检验统计量的公式,求得临界值\bar x
  4. 根据3中求得的临界值\bar x,得到接受H_0时所对应的样本均值的值,这些值构成了检验的接受域。(就是\bar x\mu_0的抽样分布上的上侧面积)
  5. 对于满足H_a\mu值,给这个\mu建立抽样分布,利用\bar x的抽样分布,和步骤4中的接受域。计算样本均值落在接受域的概率,这一概率值即为在选定\mu值处发生第二类错误的概率。(此时要用以\mu建立的抽样分布)

9.8 对总体均值进行假设检验时样本容量的确定

image

发生第一类错误的概率为\alpha,发生第二类错误的概率为\beta
c=\mu_0-z_\alpha \frac{\sigma}{\sqrt{n}}=\mu_{\alpha}+z_{\beta}\frac{\sigma}{\sqrt{n}} 这里\mu_{\alpha}为满足H_a\mu
我们对上式进行转换可得总体均值单侧假设检验中的样本容量
n=\frac{(z_{\alpha}+z_{\beta})^2\sigma^2}{(\mu_0-\mu_{\alpha})^2}
备注:双侧检验中使用z_{\alpha/2}来代替z_{\alpha}
在决定样本容量之前,需要明确能接受两类错误的概率大小。再计算即可获得样本容量的大小。

对于\alpha,\beta,n之间的关系如下:

  1. 知道其中两个,即可求另一个
  2. 给定\alpha,在n增大时\beta减小
  3. 对于给定n,\alpha\beta成反比

这里可以知道,我们不能同时减小第一类错误和第二类错误,不可兼得。


链接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取码: 333c 复制这段内容后打开百度网盘手机App,操作更方便哦

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355

推荐阅读更多精彩内容