2024-01-31 margin of error

概述

这个值指的是置信区间的左右两端点距离均值的差值。[1]

置信区间又是什么?《女士品茶》一书中说,95%的置信区间不能简单地说,真实参数有95%的概率位于这个区间内。这样理解是科学家普遍的理解,但是是错误的。应该说,如果1位科学家长期采用95%的置信区间报告实验结果,那么他写的100篇报告,有95篇的真实参数是位于置信区间内的。这就不涉及“概率”这两个字,采用频数派的观点。

margin of error 与 样本数 的关系

计算公式[2]

MoE = 1.96 \times \sigma /\sqrt{n}

其中 1.96 是正态分布累积分布函数97.5%分位点。因为两边各留2.5%,左右加起来就是5%,于是中间的区间就是95%置信区间。\sigma是总体的标准差。\sigma除以\sqrt{n}就是样本均值的标准差。(疑问:为什么不是除以 n - 1?)

margin of error是一个数,并不是比例。有时候看到margin of error是3%、2.5%,那是因为均值也是以百分比形式存在的。就好像调查问卷得到的结果,支持度百分之几。它的margin of error也以百分比形式写。

可以这样逆推吗?

《初学者科学方法指南》p75页,[3] 难以理解,也可能他们错了

现在,让我们稍微扭转一下我们的想法。 假设我们面前有一大袋蓝色和红色乒乓球,但我们不知道袋子中蓝色球和红色球的比例。 因此,我们从袋子中随机抽取 1000 个球作为样本。 我们发现正好 500 个球是红色的,500 个是蓝色的。 表 5.3 告诉我们的是,我们可以 95% 确定袋子里有 470 到 530 个球是红色的; 如果我们采集 20 个类似的样本,我们预计 20 个样本结果中有 19 个会落在 470 到 530 个红球之间。

通过别人报告的margin of error就能推测样本数吗?

虽然不知道为什么能直接套用伯努利分布。它的方差是p(1-p),所以最大值是0.25,对应标准差最大值0.5。代入到上面提到过的公式,就能从MoE推算出n需要多大。这是否就是p76页 table 4 的来源?

比如书上说如果报告支持度68%,95%的置信区间,margin of error 是 ±4%,那么可以推测样本数是500左右。

\sqrt{.68 \times (1 - .68)}/\sqrt{n} \times 1.96 = 0.04

解方程:n = (sqrt(0.68*(1-0.68))*1.96/0.04)^2,结果是n = 522


惊讶!chat bing能解这个问题

AI已经发展到这个地步了。

屏幕截图 2024-01-31 164617.png

补充

There is much confusion over the interpretation of the probability attached to confidence intervals. To understand it we have to resort to the concept of repeated sampling. Imagine taking repeated samples of the same size from the same population. For each sample calculate a 95% confidence interval. Since the samples are different, so are the confidence intervals. We know that 95% of these intervals will include the population parameter. However, without any additional information we cannot say which ones! Thus with only one sample, and no other information about the population parameter, we can say there is a 95% chance of including the parameter in our interval. Note that this does not mean that we would expect with 95% probability that the mean from another sample is in this interval. In this case we are considering differences between two sample means, which is the subject of the next chapter. [4]


参考资料

[1]: Wikipedia Margin of error 词条: This interval is called the confidence interval, and the radius (half the interval) is called the margin of error, corresponding to a 95% confidence level.

[2] stat303Moe

[3] A beginner's guide to scientific method

[4] bmj

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352

推荐阅读更多精彩内容