我们上次说到,把统计规律看成因果规律大多是人的需要。人需要把复杂的现实转化的统一、简单,而这种转化可以让现实变的连续起来。这种转化很多时候是一种有效的简化。
但是当这种思维与统计中的小样本结合起来时,可能会带给我们一些困惑。比如说在一个很大的黑盒里有很多个红色和黑色的球,各占一半。但是我们抽取了几次,每次都是黑红黑红黑红这样的顺序。我们这时可能会猜想可能这可能是盒子本身的机制。但这种小样本是反映不了实际情况的。
再比如,盒子中出现黑黑黑红红红的概率是不是要比黑红黑黑红黑的概率小呢?其实不然,每次出现任何一个球的概率都是相同的,所以它们两者的出现概率是相同的。
所以在遇到样本较小的情况下,这种总结出的因果规律或许是无效的。
但大样本下也会遭遇一个困境,就是概率最大的情况确实是出现最多的情况。例如有些教人买彩票的书就告诉某个号码组合的概率越大,出现的实际次数也就越多。但彩票中又有冷门热门的说法。
但是当你买出现概率最多的那种情况时,也许出来的是那种小概率的,总是会受到运气的影响。如果是99%vs1%,或许我们很好取舍。但如果是85%vs15%,其实15%出现的概率也是很高的。所以运气的成分就高了许多。