概述
这个值指的是置信区间
的左右两端点距离均值的差值。[1]
置信区间又是什么?《女士品茶》一书中说,95%的置信区间不能简单地说,真实参数有95%的概率位于这个区间内。这样理解是科学家普遍的理解,但是是错误的。应该说,如果1位科学家长期采用95%的置信区间报告实验结果,那么他写的100篇报告,有95篇的真实参数是位于置信区间内的。这就不涉及“概率”这两个字,采用频数派的观点。
margin of error 与 样本数 的关系
计算公式[2]
其中 1.96 是正态分布累积分布函数97.5%分位点。因为两边各留2.5%,左右加起来就是5%,于是中间的区间就是95%置信区间。是总体的标准差。除以就是样本均值的标准差。(疑问:为什么不是除以 n - 1?)
margin of error是一个数,并不是比例。有时候看到margin of error是3%、2.5%,那是因为均值也是以百分比形式存在的。就好像调查问卷得到的结果,支持度百分之几。它的margin of error也以百分比形式写。
可以这样逆推吗?
《初学者科学方法指南》p75页,[3] 难以理解,也可能他们错了
现在,让我们稍微扭转一下我们的想法。 假设我们面前有一大袋蓝色和红色乒乓球,但我们不知道袋子中蓝色球和红色球的比例。 因此,我们从袋子中随机抽取 1000 个球作为样本。 我们发现正好 500 个球是红色的,500 个是蓝色的。 表 5.3 告诉我们的是,我们可以 95% 确定袋子里有 470 到 530 个球是红色的; 如果我们采集 20 个类似的样本,我们预计 20 个样本结果中有 19 个会落在 470 到 530 个红球之间。
通过别人报告的margin of error就能推测样本数吗?
虽然不知道为什么能直接套用伯努利分布。它的方差是,所以最大值是,对应标准差最大值。代入到上面提到过的公式,就能从MoE推算出需要多大。这是否就是p76页 table 4 的来源?
比如书上说如果报告支持度68%,95%的置信区间,margin of error 是 ±4%,那么可以推测样本数是500左右。
解方程:n = (sqrt(0.68*(1-0.68))*1.96/0.04)^2
,结果是。
惊讶!chat bing能解这个问题
AI已经发展到这个地步了。
补充
There is much confusion over the interpretation of the probability attached to confidence intervals. To understand it we have to resort to the concept of repeated sampling. Imagine taking repeated samples of the same size from the same population. For each sample calculate a 95% confidence interval. Since the samples are different, so are the confidence intervals. We know that 95% of these intervals will include the population parameter. However, without any additional information we cannot say which ones! Thus with only one sample, and no other information about the population parameter, we can say there is a 95% chance of including the parameter in our interval. Note that this does not mean that we would expect with 95% probability that the mean from another sample is in this interval. In this case we are considering differences between two sample means, which is the subject of the next chapter. [4]
参考资料
[1]: Wikipedia Margin of error 词条: This interval is called the confidence interval, and the radius (half the interval) is called the margin of error, corresponding to a 95% confidence level.
[2] stat303Moe
[3] A beginner's guide to scientific method
[4] bmj