为什么理想和现实总存在偏差？关键就是两个字：概率

想确保成功，你会怎么做？普通人可能会说做好各种预案，排除可能的阻碍。这固然没错，但这只是理想情况。而现实中成功的发生，离不开概率。

来看一组数字：假如有50%的成功可能性，那至少要尝试4次，才能确保成功一次；如果只有5%的成功可能性，大约需要50次才能确保成功一次。

这样的结论，或许和你对于概率的感知有些不太一样。不用困惑，下面专门和你说说一说，在概率层面，为什么理想和现实总存在着偏差。

扔十次硬币，会有五次正面吗

随机性的规律性其实和我们直觉想象的不一样，以至于在生活中大部分人会误读概率。

比如说，我们知道抛硬币正反两面朝上的概率各50%，但你现在去抛十次硬币，真的有5次正面朝上么？其实这种可能性只有25%左右，显然和大多数人的直觉完全不同了。

再比如有一个赌局，赢面是10%，你玩十次是否就能保证赢一次呢？如果不能，需要多少次才有很高的把握赢一次呢？这个结果其实是26次，这可能也颠覆了你的认知。

因此，我会通过一些例子讲清楚随机性到底意味着什么，我们该如何得到正确的统计规律，而不是主观偏见。

我们都知道，统计学的规律只有经过了大量随机试验才能得出，也才有意义。但是随机试验得到的结果，和我们用古典概率算出来的结论可能是两回事。

不仅你掷10次硬币大部分时候不可能得到五次正面朝上的结果，你做其它随机试验也是如此。比如你掷12次骰子，大约只有30%的情况它正好有两次六点朝上。这时你是否能讲，有70%的可能性要否定六点朝上的概率是1/6这个结论呢？似乎也不应该这么武断。

这里面到底哪里出了问题？这其中的关键是，如何解释真实情况和理想中的概率之间的偏差。

现实和理想概率有偏差

几百年前，法国数学家伯努利等人为了回答这个问题，就开始做一些最简单的随机试验，这种试验简单到只有两种结果，非A即B，没有第三种状态，而且在同样条件下重复这种试验，A和B发生的概率需要一致。

比如抛硬币，每次正面朝上的概率是1/2；掷骰子，事件A是“六点朝上”，它出现的概率每次也是1/6。当然事件B就是其它点朝上，每次的概率是5/6。在一般情况下，出现A的概率是p，B的概率是1-p。这类试验后来被称为伯努利试验。

好了，基本的设定讲清楚了。我们来分析一下掷硬币的问题。照理讲，我们掷10次硬币，正面朝上的次数应该是5次。但是如果你真的拿一个硬币去试试，你会发现可能只有三次正面朝上，也可能四次正面朝上，甚至会出现没有一次正面朝上的情况。

如果我们把从0次正面朝上，也就是说全部是背面朝上，到10次全是正面朝上的可能性都算出来，画成一个折线图，就是一个中间鼓起的曲线：

图片发自简书App

从图中可以看出，虽然5次正面朝上的可能性最大，但是只有1/4左右。

造成试验结果和理论值不一致的原因，是试验十次数量太少，统计的规律性被试验的随机性掩盖了。

如果我们做更多的随机试验，规律性是否会更清晰一点呢？

比如我们做100次试验，这时你会发现，80%的情况下，正面朝上出现了40-60次。如果我们继续放大试验次数，你会发现绝大多数情况正面朝上的次数在一半左右浮动，那种正面朝上占比特别少或者特别多的可能性几乎不会出现，而不是像一开始那样，什么情况都有可能。

当然，如果你做1000次试验，在99.9%的情况下正面朝上的次数在400-600之间。即使你把浮动的范围缩小到450-550，99.7%的情况下正面朝上落在这个范围内。

在一般情况下，如果进行N次这种简单的伯努利试验，那么事件A会发生多少次呢？虽然我们感觉应该是总次数N乘以每次发生的概率p，但是实际上事件A发生多少次都是有可能的。当然发生N*p次的可能性最大，接下来发生N*p+1或者N*p-1次的可能性次之，然后向两头逐渐递减。

如果我们将它画成一条曲线，就是中间高两头低的曲线。顺便说一下，满足这种曲线的概率分布，被称为伯努利分布，也称为二项式分布，因为每一次试验的结果有两种。

我们还看这个实验，事实上，如果试验次数N比较大，那中间就是一个大鼓包，然后快速下降，两旁几乎是零，这也就是说事件A发生的次数在N*p左右的可能性极大，其它的可能性极小。相反，如果总次数N比较小，中间的鼓包就比较平缓，两头的值虽然小，但不会是零，其实难以判定事件A到底发生了多少次。

于是，我们就得到这样一个结论：有关不确定性的规律，只有在大量随机试验时才显现出来，当试验的次数不足，它则显现出偶然性和随意性。

找出这个偏差的本质

当然，在数学上我们不能用“曲线比较鼓”，或者“比较平”之类不严格的语言来描述一种规律。我们需要用两个非常准确的概念来定量描述“鼓”和“平”的差别。

第一个概念就是平均值或者叫做数学期望值，也就是N*p，因为概率是p的事件进行N次试验后，平均发生的次数，也是最可能发生的次数，好，这是N*p。

接下来我们再用平方差（简称方差）这个概念来描述曲线的“鼓”与“平”。“方差”这个词你可能并不陌生，那么什么是方差，它是如何计算的呢？我们下面就简单地说一说。

方差其实是对误差的一种度量，既然是误差，就要有可对比的基点，在概率中，这个基准点就是数学期望值（简称期望值），也就是我们通常说的平均值。比如说，做10次抛硬币的试验，平均值就是5次正面朝上，5就是基点。

如果我们做10次试验只出现4次正面朝上的情况，就有了误差，误差是1。如果9次正面朝上，那么误差就大了，就是4。好了，接下来我们就把各种误差，和产生那些误差的可能性一起考虑，做一个加权平均，算出来的“误差”就是平方差。

之所以使用“平方”这个词，是因为计算方差这种误差时用到了平方，为了进一步方便误差和平均值的比较，我们通常会对方差开根号一次，这样得到的结果被称为标准差（严格来讲，方差开根号后和标准差还是略有差别，但是这个差别很小，为了便于理解，我们就假定标准差是方差开根号的结果）。

关于方差和标准差的公式我们就省略了，大家只要记住下面这个结论就可以了：伯努利试验或者其它类似的试验，试验的次数越多，方差和标准差越小，概率的分布越往平均值N*p的位置集中。

显然，在这种情况下，你用A发生的次数，除以试验次数N，当作A发生的概率，就比较准确。

反之，试验的次数越少，概率分布的曲线就越平，也就是说A发生多少次的可能性都存在，这时你用A发生的次数，除以试验次数N，当作A发生的概率，误差可能会很大。

具体到抛硬币的试验，进行100次试验，标准差大约是5次，也就是误差相比平均值50，大约是10%。但是如果我们做10000次试验，标准差大约只有50，因此和平均值相比，降到了1%左右。

成功需要更多准备

有了方差的概念，我们就能定量分析“理想”和现实的差距了。什么是理想呢？我们进行N次伯努利试验，每一次事件A发生的概率为p，N次下来发生了N*p次，这就是理想。那么什么是现实呢？由于标准差的影响，使得实际发生的次数严重偏离N*p，这就是现实。

比如，在生活中，很多人觉得某件事有1/N发生的概率，只要他做N次，就会有一次发生，这只是理想。

事实上，越是小概率事件，理想和现实的差距越大。

比如说一件事发生的概率为1%，虽然进行100次试验后它的数学期望值达到了1，但是这时它的标准差大约也是1，也就是说误差大约是100%，因此试了100次下来，可能一次也没有成功。

如果你想确保获得一次成功怎么办呢？你大约要做260次左右的试验，而不是100次。这里面的数学细节我们就不讲了，大家记住这个结论就好，就是越是小概率事件，你如果想确保它发生，需要试验的次数比理想的次数越要多得多。

比如买彩票这种事情。你中奖的概率是一百万分之一，你如果要想确保成功一次，恐怕要买260万次彩票。你即使中一回大奖，花的钱要远比获得的多得多。

因此，了解了标准差，就该懂得人为什么不要去赌。这算是我们今天在认知方面要了解的第一个知识点。

我们要了解的第二个知识点是，提高单次成功率要远比多做试验更重要。

假如你有50%的成功可能性，你基本上尝试4次，就能确保成功一次，当然理想状态是尝试两次。为了保险起见，要多做100%的工作。但是如果你只有5%的成功可能性，大约需要50次才能确保成功一次，而不是理想状态中的20次。为了保险起见，要多做150%的工作。

很多人喜欢赌小概率事件，觉得它成本低，大不了多来几次，其实由于误差的作用，要确保小概率事件发生，成本要比确保大概率事件的发生高得多。

关于概率论和统计学的规律，还有很多和大家直觉不相符的地方。比如我们前面所说的各种大量的随机试验，需要在相同条件下进行，而且前后各次试验是彼此不会相互影响的。这两件事在现实中，还真不容易满足。

就拿掷骰子来说吧，看似掷N次不过是掷一次的多次重复，但实际上掷的次数多了骰子会磨损，桌面也会砸出坑，这些细微的差异累积下来就会产生不同的结果，我们原以为试几次就能发生的事情，可能没有发生，这就要我们事先考虑更多的余量。

小结

我们从概率论上证明了，凡事做好充足的准备，争取一次性成功，这要远比不断尝试小概率事件靠谱得多。

同时涉及到随机性的问题时，只有通过大量可重复性的试验，才能看到规律性，而数量较少的试验，更多地体现出来的是随意性和偶然性，而非规律性。

为什么理想和现实总存在偏差？关键就是两个字：概率

友情链接更多精彩内容