为什么理想和现实总存在偏差?关键就是两个字:概率

想确保成功,你会怎么做?普通人可能会说做好各种预案,排除可能的阻碍。这固然没错,但这只是理想情况。而现实中成功的发生,离不开概率。

来看一组数字:假如有50%的成功可能性,那至少要尝试4次,才能确保成功一次;如果只有5%的成功可能性,大约需要50次才能确保成功一次。

这样的结论,或许和你对于概率的感知有些不太一样。不用困惑,下面专门和你说说一说,在概率层面,为什么理想和现实总存在着偏差。

1

扔十次硬币,会有五次正面吗

随机性的规律性其实和我们直觉想象的不一样,以至于在生活中大部分人会误读概率。

比如说,我们知道抛硬币正反两面朝上的概率各50%,但你现在去抛十次硬币,真的有5次正面朝上么?其实这种可能性只有25%左右,显然和大多数人的直觉完全不同了。

再比如有一个赌局,赢面是10%,你玩十次是否就能保证赢一次呢?如果不能,需要多少次才有很高的把握赢一次呢?这个结果其实是26次,这可能也颠覆了你的认知。

因此,我会通过一些例子讲清楚随机性到底意味着什么,我们该如何得到正确的统计规律,而不是主观偏见。

我们都知道,统计学的规律只有经过了大量随机试验才能得出,也才有意义。但是随机试验得到的结果,和我们用古典概率算出来的结论可能是两回事。

不仅你掷10次硬币大部分时候不可能得到五次正面朝上的结果,你做其它随机试验也是如此。比如你掷12次骰子,大约只有30%的情况它正好有两次六点朝上。这时你是否能讲,有70%的可能性要否定六点朝上的概率是1/6这个结论呢?似乎也不应该这么武断。

这里面到底哪里出了问题?这其中的关键是,如何解释真实情况和理想中的概率之间的偏差。

2

现实和理想概率有偏差

几百年前,法国数学家伯努利等人为了回答这个问题,就开始做一些最简单的随机试验,这种试验简单到只有两种结果,非A即B,没有第三种状态,而且在同样条件下重复这种试验,A和B发生的概率需要一致。

比如抛硬币,每次正面朝上的概率是1/2;掷骰子,事件A是“六点朝上”,它出现的概率每次也是1/6。当然事件B就是其它点朝上,每次的概率是5/6。在一般情况下,出现A的概率是p,B的概率是1-p。这类试验后来被称为伯努利试验。

好了,基本的设定讲清楚了。我们来分析一下掷硬币的问题。照理讲,我们掷10次硬币,正面朝上的次数应该是5次。但是如果你真的拿一个硬币去试试,你会发现可能只有三次正面朝上,也可能四次正面朝上,甚至会出现没有一次正面朝上的情况。

如果我们把从0次正面朝上,也就是说全部是背面朝上,到10次全是正面朝上的可能性都算出来,画成一个折线图,就是一个中间鼓起的曲线:


图片发自简书App


从图中可以看出,虽然5次正面朝上的可能性最大,但是只有1/4左右。

造成试验结果和理论值不一致的原因,是试验十次数量太少,统计的规律性被试验的随机性掩盖了。

如果我们做更多的随机试验,规律性是否会更清晰一点呢?

比如我们做100次试验,这时你会发现,80%的情况下,正面朝上出现了40-60次。如果我们继续放大试验次数,你会发现绝大多数情况正面朝上的次数在一半左右浮动,那种正面朝上占比特别少或者特别多的可能性几乎不会出现,而不是像一开始那样,什么情况都有可能。

当然,如果你做1000次试验,在99.9%的情况下正面朝上的次数在400-600之间。即使你把浮动的范围缩小到450-550,99.7%的情况下正面朝上落在这个范围内。

在一般情况下,如果进行N次这种简单的伯努利试验,那么事件A会发生多少次呢?虽然我们感觉应该是总次数N乘以每次发生的概率p,但是实际上事件A发生多少次都是有可能的。当然发生N*p次的可能性最大,接下来发生N*p+1或者N*p-1次的可能性次之,然后向两头逐渐递减。

如果我们将它画成一条曲线,就是中间高两头低的曲线。顺便说一下,满足这种曲线的概率分布,被称为伯努利分布,也称为二项式分布,因为每一次试验的结果有两种。

我们还看这个实验,事实上,如果试验次数N比较大,那中间就是一个大鼓包,然后快速下降,两旁几乎是零,这也就是说事件A发生的次数在N*p左右的可能性极大,其它的可能性极小。相反,如果总次数N比较小,中间的鼓包就比较平缓,两头的值虽然小,但不会是零,其实难以判定事件A到底发生了多少次。

于是,我们就得到这样一个结论:有关不确定性的规律,只有在大量随机试验时才显现出来,当试验的次数不足,它则显现出偶然性和随意性。

3

找出这个偏差的本质

当然,在数学上我们不能用“曲线比较鼓”,或者“比较平”之类不严格的语言来描述一种规律。我们需要用两个非常准确的概念来定量描述“鼓”和“平”的差别。

第一个概念就是平均值或者叫做数学期望值,也就是N*p,因为概率是p的事件进行N次试验后,平均发生的次数,也是最可能发生的次数,好,这是N*p。

接下来我们再用平方差(简称方差)这个概念来描述曲线的“鼓”与“平”。“方差”这个词你可能并不陌生,那么什么是方差,它是如何计算的呢?我们下面就简单地说一说。

方差其实是对误差的一种度量,既然是误差,就要有可对比的基点,在概率中,这个基准点就是数学期望值(简称期望值),也就是我们通常说的平均值。比如说,做10次抛硬币的试验,平均值就是5次正面朝上,5就是基点。

如果我们做10次试验只出现4次正面朝上的情况,就有了误差,误差是1。如果9次正面朝上,那么误差就大了,就是4。好了,接下来我们就把各种误差,和产生那些误差的可能性一起考虑,做一个加权平均,算出来的“误差”就是平方差。

之所以使用“平方”这个词,是因为计算方差这种误差时用到了平方,为了进一步方便误差和平均值的比较,我们通常会对方差开根号一次,这样得到的结果被称为标准差(严格来讲,方差开根号后和标准差还是略有差别,但是这个差别很小,为了便于理解,我们就假定标准差是方差开根号的结果)。

关于方差和标准差的公式我们就省略了,大家只要记住下面这个结论就可以了:伯努利试验或者其它类似的试验,试验的次数越多,方差和标准差越小,概率的分布越往平均值N*p的位置集中。

显然,在这种情况下,你用A发生的次数,除以试验次数N,当作A发生的概率,就比较准确。

反之,试验的次数越少,概率分布的曲线就越平,也就是说A发生多少次的可能性都存在,这时你用A发生的次数,除以试验次数N,当作A发生的概率,误差可能会很大。

具体到抛硬币的试验,进行100次试验,标准差大约是5次,也就是误差相比平均值50,大约是10%。但是如果我们做10000次试验,标准差大约只有50,因此和平均值相比,降到了1%左右。

4

成功需要更多准备

有了方差的概念,我们就能定量分析“理想”和现实的差距了。什么是理想呢?我们进行N次伯努利试验,每一次事件A发生的概率为p,N次下来发生了N*p次,这就是理想。那么什么是现实呢?由于标准差的影响,使得实际发生的次数严重偏离N*p,这就是现实。

比如,在生活中,很多人觉得某件事有1/N发生的概率,只要他做N次,就会有一次发生,这只是理想。

事实上,越是小概率事件,理想和现实的差距越大。

比如说一件事发生的概率为1%,虽然进行100次试验后它的数学期望值达到了1,但是这时它的标准差大约也是1,也就是说误差大约是100%,因此试了100次下来,可能一次也没有成功。

如果你想确保获得一次成功怎么办呢?你大约要做260次左右的试验,而不是100次。这里面的数学细节我们就不讲了,大家记住这个结论就好,就是越是小概率事件,你如果想确保它发生,需要试验的次数比理想的次数越要多得多。

比如买彩票这种事情。你中奖的概率是一百万分之一,你如果要想确保成功一次,恐怕要买260万次彩票。你即使中一回大奖,花的钱要远比获得的多得多。

因此,了解了标准差,就该懂得人为什么不要去赌。这算是我们今天在认知方面要了解的第一个知识点。

我们要了解的第二个知识点是,提高单次成功率要远比多做试验更重要。

假如你有50%的成功可能性,你基本上尝试4次,就能确保成功一次,当然理想状态是尝试两次。为了保险起见,要多做100%的工作。但是如果你只有5%的成功可能性,大约需要50次才能确保成功一次,而不是理想状态中的20次。为了保险起见,要多做150%的工作。

很多人喜欢赌小概率事件,觉得它成本低,大不了多来几次,其实由于误差的作用,要确保小概率事件发生,成本要比确保大概率事件的发生高得多。

关于概率论和统计学的规律,还有很多和大家直觉不相符的地方。比如我们前面所说的各种大量的随机试验,需要在相同条件下进行,而且前后各次试验是彼此不会相互影响的。这两件事在现实中,还真不容易满足。

就拿掷骰子来说吧,看似掷N次不过是掷一次的多次重复,但实际上掷的次数多了骰子会磨损,桌面也会砸出坑,这些细微的差异累积下来就会产生不同的结果,我们原以为试几次就能发生的事情,可能没有发生,这就要我们事先考虑更多的余量。

5

小  结

我们从概率论上证明了,凡事做好充足的准备,争取一次性成功,这要远比不断尝试小概率事件靠谱得多。

同时涉及到随机性的问题时,只有通过大量可重复性的试验,才能看到规律性,而数量较少的试验,更多地体现出来的是随意性和偶然性,而非规律性。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容