(译)假设检验:显著性水平(Alpha)和P值

在假设检验中,显着性水平和P值意味着什么? 究竟什么是统计显著性? 在这篇文章中,我主要用概念和图形来帮助读者更直观地理解假设检验在统计学中的工作原理。
为了实现它,我将显着性水平和P值添加到我之前的帖子的图形中,以便展示单样本t检验的图形化版本。
这是我们在上一篇文章中离开的地方。 我们想确定我们的样本平均值(330.6)是否表明今年的平均能源成本与去年的平均能源成本(260)显着不同。


上面的概率分布图显示了我们在假设零假设为真(总体均值= 260)的情况下获得的样本均值分布,并且我们反复绘制了大量随机样本。
我给你留下了一个问题:我们在图表上哪里绘制一条线来表示统计显著性? 现在我们将添加显着性水平和P值,这是我们需要的决策工具。
我们将使用这些工具来测试以下假设:

  • 零假设:总体均值等于假设均值(260)
  • 备选假设:总体均值与假设均值不同(260)

什么是显着性水平(\alpha)?

显着性水平,也表示为alphaα,是在零假设为真时拒绝零假设的概率。 例如,显着性水平0.05表示当没有实际差异时得出存在差异的5%风险。
由于其技术性质,这些类型的定义很难理解。 图片使概念更容易理解!
显着性水平决定了我们在图上绘制该线到零假设值的距离。 为了显示0.05的显着性水平,我们需要在距离零假设最远的5%的分布绘制阴影。


在上图中,两个阴影区域与零假设值等距,每个区域的概率为0.025,总共为0.05。 在统计学中,我们将这些阴影区域称为双尾测试的临界域(critical region )。 临界域决定了我们的样本统计量与零假设值之间的距离,在我们可以说它不足以拒绝零假设之前。
我们的样本均值(330.6)在临界域内,这表明它在0.05水平上具有统计学意义。
我们还可以使用0.01的其他常见显着性水平来判断它是否具有统计学意义。

两个阴影区域的概率均为0.005,总概率为0.01。 这次我们的样本均值不在临界域内,我们不能拒绝零假设。这个比较展示了你在开始学习之前为什么需要选择显着性水平的原因。它可以让你不需要选择显着性水平,因为它很方便地为你提供显着性的结果。
使用图表,我们能够确定我们的结果在0.05水平上具有统计显着性,而不需要使用P值。 但是,当你使用统计软件生成数字输出时,你需要将P值与你的显着性水平进行比较才可以得出结果。

什么是P值?

P值是假设零假设为真时所得到的样本观察结果或获得更极端的结果的概率。
P值的这个定义虽然在技术上是正确的,但有点复杂。 用图表更容易理解!
为了绘制我们的示例数据集的P值,我们需要确定样本均值和零假设值之间的距离(330.6-260 = 70.6)。 接下来,我们可以绘制获得样本均值的概率,该均值至少在分布的两个尾部中都是极端的(260 +/- 70.6)。



在上图中,两个阴影区域的概率均为0.01556,总概率为0.03112。 如果总体均值为260,则该概率表示获得至少与分布尾部中的样本均值一样极端的样本均值的可能性。这是我们的P值!
当P值小于或等于显着性水平时,拒绝零假设。 如果我们将P值作为示例并将其与常用显着性水平进行比较,则它与先前的图形结果相匹配。 P值0.03112在α水平为0.05时具有统计显着性,但在0.01水平时不具有统计学意义。
如果我们坚持0.05的显着性水平,我们可以得出结论,人口的平均能源成本大于260。

关于统计显着性结果的讨论

假设检验评估关于总体的两个相互排斥的陈述,以确定样本数据最佳支持哪个陈述。 当样本统计量相对于零假设足够异常时,测试结果具有统计学意义,即我们可以拒绝整个总体的零假设。 假设检验中的“异常”定义为:

  • 零假设为真的假设——图表以零假设值为中心。
  • 显着性水平——临界线距离零假设值是多远?
  • 我们的样本统计量——是否属于临界域?

请记住,没有神奇的显着性水平可以区分具有真实效果的研究和不具有100%准确性的研究。 常见的alpha值0.05和0.01仅仅基于传统。 对于0.05的显着性水平,期望在零假设为真时的5%的临界域中获得样本均值。在这些情况下,你不会知道零假设是正确的,但你会拒绝它,因为样本均值落在临界区域。这就是为什么显着性水平也被称为错误率!
显着性水平和P值是帮助你在假设检验中量化和控制此类错误的重要工具。 使用这些工具来决定何时拒绝原假设会增加你做出正确决策的机会。


原文链接


都看到最后了,要不~点个赞?加波关注?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,222评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,455评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,720评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,568评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,696评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,879评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,028评论 3 409
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,773评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,220评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,550评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,697评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,360评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,002评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,782评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,010评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,433评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,587评论 2 350

推荐阅读更多精彩内容