6.3 假设检验的决策依据-显著性水平怎么算

以总体均值的假设检验为例讲述如何做出决策。

1. 基于统计量进行决策

① 前面说过很多遍:样本均值服从期望为总体均值\mu,方差为\frac{\sigma ^2}{n}的正态分布。

② 原假设是,总体的均值等于\mu_0,即\mu = \mu_0

③ 如果总体均值真的真的真的就是\mu_0,根据①的描述,样本均值的概率分布就是酱婶儿的:\bar x N(\mu_0, \frac{\sigma^2}{n}),(σ未知时用s代替),进一步写为:\frac{\bar x - \mu_0}{s/\sqrt{n}}N(0, 1)

④ 根据事先设定好的显著性水平α,给上述分布划定拒绝域和非拒绝域(最重要一步)

这个图太丑了

拒绝域如何划定和使用:

i. 首先根据设定的显著性水平α对称的划定阴影区域(区域面积为α)。如果原假设是正确的,那么采集的样本的均值落到阴影区域的概率是α。通常事先设定的α阈值都是非常小的,比如0.05,0.01等。如果原假设是正确的,样本均值落到阴影区域的概率是非常低的。阴影部分就叫拒绝域。,

ii. 如果我们采集了一个样本,其均值恰好落在了阴影区域,代表着:在原假设正确的前提下,一个概率非常低的事件发生了。这意味着原假设很可能是不对的,所以我们拒绝原假设。这就是为什么阴影区域叫拒绝域。

iii. 原假设是正确的也有α的概率样本均值落在了拒绝域,因此α也代表了“原假设是正确的我们却拒绝了原假设”的概率,即第I类错误概率。

iv. 上述描述以双侧检验为例,单侧检验也是类似的。

基于统计量的进行决策时,只把标准化后的统计量分布划分了拒绝域与非拒绝域,然后根据估计值落在了哪里来决定是拒绝还是不拒绝原假设,而没有进一步考察估计值具体落在了哪里,比如离拒绝域与非拒绝域的界线是近还是远,这相当于丢失了一部分信息。结果是,只给出了犯第I类错误的概率上限,这个上限就是事先确定好的α,而没有给出,犯第I类错误的概率具体是多少。

2. 基于P值进行决策

弄懂了基于统计量进行决策,根据P值进行决策就很简单了。简述如下:

① 与上述相同,基于原假设,样本均值服从分布:\frac{\bar x - \mu_0}{s/\sqrt{n}} ~ N(0, 1)

② 实际采样计算出来一个样本均值,即一个估计值\bar x _ 0

③ 以该值(标准化后)为界,划分拒绝域与非拒绝域(具体划分方式依是双侧检验、右侧检验还是左侧检验而定);

④ 以该值为界划分拒绝域与非拒绝域时,可以反推出对应的显著性水平,记为P,称为“观察到的显著性水平”;

⑤ 若P<α,则拒绝原假设,若P>α,则不拒绝原假设。

基于P值进行决策的好处时,在做出来拒绝原假设的决策后,可以给出犯第I类错误的概率具体为P(而不是上界为α)。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。