人家说男人有三大错觉,有人敲门,手机在响,她喜欢我。是不是真的有人敲门出去看看就是,手机有没有在响来出来看看就是了,但是她是不是真的喜欢我这件事如果贸贸然跑去问那极有可能会变成平头哥[1]。
难道我们注定一辈子期期艾艾不敢对喜欢的女孩子说喜欢?难道真的注定孤单一辈子么?!
听说过贝叶斯么?这个三百前的男人提出的贝叶斯概率论
为我们带来了一线曙光。
贝叶斯概率的神奇之处在于:在我们生活中一些你感觉:好像是,大概是,可能是的事情原来是可以用数据计算的。
接下来让我们说一说贝叶斯概率是怎么解决“她是不是喜欢我这个问题的”。
第一步,跟着感觉走
对于她是不是喜欢我
这件事无非是两种结果[2]:
她喜欢我
她不喜欢我
既然是假设,我们不妨乐观一点估计,比如她喜欢我
的概率为60%,那么她不喜欢我
的概率就为40%。在贝叶斯概率中,像这种设定某一类别的概率称之为先验概率
。
像上面说的,她喜欢我
的概率和她不喜欢我
的概率分别为60%和40%,我们可以用两个面积之比为3:2的长方形来描述这个事件。而且整个事件的概率之和为1,意思就是说这两个长方形的面积之和为1,为了方便计算我们将整个事件想象成一个边长为1的正方形,如果继续看下去我们就会发现用面积来表达概率是解释贝叶斯概率的精髓。
第二步,再多点线索
然而光靠经验还是无法避免成为平头哥,这个时候我们就需要一点新的信息来确认姑娘心里究竟在想些什么。
我们都说女神有三宝:干嘛,呵呵,去洗澡。如果你收到女神三宝,大概率就凉凉了。当然如果我们能统计一下女神们如果对男生感兴趣的时候发出女神三宝的概率和对男生不感兴趣的时候发出女神三宝的概率会让我们的结果更准确,在这个例子中,我们没有去实际调查而是仅凭经验来设定概率。
假如她不喜欢我,那么大概率会收到女神三宝,假如是80%,如果她喜欢哦,当然也可能会收到女神三宝,只是概率会小很多,比如30%。
像这种设定某一事件发生的概率,在贝叶斯概率中称之为条件概率
。
第三步,排除不可能的情况
在我们设定好某一事件发生后的概率之后,静静等待她有没有发出女神三宝。假如我们的运气不佳,真的收到女神三宝了,先不要气馁,擦干眼泪算一算凉凉的概率有多大。
还记得这张图么,我设定了各种情况下的概率,现在我们收到了女神三宝,也就是说没有收到女神三宝的情况已经不存在了,那么就要把没收到女神三宝的情况排除掉,也就是图中阴影部分需要被删除。
所以最后的结果就是她不喜欢我
的概率就是32%,她喜欢我
的概率就是18%么?别着急,这还不是最后的结果。还记得我们要计算的这件事的面积应该是1这件事么,然而现在我们排除掉计算结果之后得到的结果求和:
还有0.5去哪了?
还记得我们最早说的,概率其实是面积之比,且类别之和为1,那么真正的她喜欢我和她不喜欢我面积之比应该是:
,也就是,在面积之和为1的情况下,在收到女神三宝的条件下,她喜欢我
的概率为
而相应的,在收到女神三宝的条件下,她不喜欢我
的概率为
所以在收到女神三宝的情况下,她喜欢我
的概率变成了36%。
不用气馁
所以这就是结局了么?百分之36%?没戏了?
不是的,贝叶斯推理并不是一击定乾坤,而是根据信息的不断增加来不断修改概率。在上面的例子中我们只根据有没有收到女神三宝这一个信息来判断她是不是喜欢我,而我们得到的36%概率称之为后验概率
。而我们还可以增加一些信息,比如约她出去看电影她有没有答应,约她出去吃饭有没有答应来不断的更新这个概率,不过要记得,当你增加这些信息的时候,原来的后验概率
需要变成先验概率
来计算。如果你设定一个标准,比如她喜欢我
的概率达到90%,这事就稳了,或者她喜欢我
的概率变成15%这事就凉凉了,那么就不断增加信息,直到你确信她到底喜不喜欢我。
最后
最后向大家推荐一本书:小岛宽之的《统计学关我什么事》。本文的例子与想法基本是脱胎于此书,本文中没有说清楚的很多概念在此书中必定能搞清楚。
而我在写这篇小文的过程中真切的感受到要写一点通俗易懂的文字有多困难。而这本书真正做到了由浅入深,通俗易懂。