1、请考虑下列情境,凭直觉写出答案。
一辆出租车的夜晚肇事后逃逸。
这座城市有两家出租车公司,其中一家公司的出租车是绿色的,另一家是蓝色的。
你知道以下数据:
这座城市85%的出租车是绿色的,15%是蓝色的。
一位目击证人辨认出那辆肇事出租车是蓝色的。当晚,警察在出事地点对证人的证词进行了测试,得出的结论是:目击者在当时能够正确辨认出这两种颜色的概率是80%,错误的概率是20%。
这场事故的出租车是蓝色而不是绿色的概率是多少?
这是“贝叶斯定理”的一个标准问题。
(读书思考1:绿色的出租车被看成是蓝色的概率是85%×20%=0.17,蓝色的出租车被看成是蓝色的概率是15%×80%=0.12,所以这场事故的出租车是蓝色而不是绿色的概率是0.15×0.8÷(0.17+0.12)=41.38%。)
(读书思考2:作者试图教会我们理性思考,用逻辑解决问题。但在这个直觉试验中,作者没有说是否找了名校学习统计学的受试者进行实验。在不了解或者从没听过贝叶斯定理时,尤其是数学不好的人,确实很难计算出上述数学问题,只能凭直觉或者猜测给出答案。但数学较好,学习过贝叶斯定理的人,难道就不会轻松计算出概率,不受心理学上的因素影响?)
2、“统计学基础比率”(statistical base rates)是指某一事件所属类别的事实总量,与单独事件无关;而“因果关系基础比率”(causal base rates)则会改变你对单独事件的看法。对两种基础比率,人们往往会区别对待:
统计学基础比率普遍受到轻视,当人们手头有与该事件相关的具体信息时,有时还会完全忽略这一比率。
因果关系基础比率被视为个别事件的信息,人们很容易将这一比率与其他具体事件的信息结合起来考虑问题。
3、思维定式是指人们会(至少暂时会)将自己对某个团队的看法延伸到这个团体中每一个成员的身上(团体存在某些问题,其中的成员无一例外也都会有这些问题)。
4、思维定式在我们的文化中是个贬义词,但我把它当成一个中性词来用。系统1的基本特征之一就是它代表了范畴规范和原型范例。这样的规范和范例决定了我们怎样看待马、冰箱及纽约市的警察,因为我们会在记忆里存储与所有这些范畴的事物或人相关的一个或多个“规范的”典型形象。当这些范畴具有社会性时,这些典型形象就被称为思维定式。有些思维定式的错误是致命的,负面的思维定式可能会产生可怕的后果,但这样的心理学事实无法避免:不管是对是错,思维定式都是我们对不同范畴事物的看法。
5、我们并没有自己想的那样乐于助人。
6、我们大多数人都认为自己十分正直,在那样的情况下,都会义无反顾地提供帮助。当然,这项试验的意义就是去证实那样的期望是错误的。即使是普通、正直的人也不会冲过去提供帮助,因为他们希望别人能够处理这种令人不快的癫痫发作情况。
7、有些人的行为令人惊讶,了解这些行为的统计学事实的人也会将这些事实告诉别人,就在这种转述的过程中,他们的印象得以加深,但这并不意味着他们的世界观也会随之改变。学习心理学面临的考验是,你对所处环境的理解是否发生了改变,而不是你是否了解到一个新的事实。我们对于数据的想法以及我们对于个体案例的想法存在很大的差距。相较于非因果关系的信息来说,用因果关系进行解释的统计学结果对我们的想法影响更大。但即使是具有说服力的因果关系统计数据也不会改变我们在个人经历中形成的长期坚守或是根深蒂固的信念。此外,令人惊讶的个体案例影响甚大,是教授心理学更为有效的手段,因为个案与统计数据的分歧需要调解,并被嵌入一种因果关系里,正因为如此,本书才包含种种直接向各位读者提问的问题。与从别人那儿听到令人惊奇的事实相比,你更有可能因为从自己的行为中发现惊人的事实而学到知识。
读书备注:
贝叶斯定理的过程可以归纳为:“过去经验”加上“新的证据”得到“修正后的判断”。它提供了一种将新观察到的证据和已有的经验结合起来进行推断的客观方法。
假设有随机事件A和B,它们的条件概率关系可以用以下数学公式表达:
其中,事件A是要考察的目标事件,P(A)是事件A的初始概率,称为先验概率,它是根据一些先前的观测或者经验得到的概率。
B是新出现的一个事件,它会影响事件A。P(B)表示事件B发生的概率。
P(B|A)表示当A发生时B的概率,它是一个条件概率。
P(A|B)表示当B发生时A的概率(也是条件概率),它是我们要计算的后验概率,指在得到一些观测信息后某事件发生的概率。
贝叶斯公式给出了通过先验概率和条件概率求出后验概率的方法。举个例子,我们假设A事件代表堵车,B事件代表下雨,并且已知以下数据:
某天下雨的概率是40%,即P(下雨)=0.4。
上班堵车的概率是80%,即P(堵车)=0.8。
如果上班堵车,则这天是雨天的概率有30%,即P(下雨|堵车)=0.3。
那么,我们就能求出下雨天上班堵车的概率:
P(堵车|下雨)
=P(堵车)✖️P(下雨|堵车)➗P(下雨)
=0.8✖️0.3➗0.4
=0.6
这个计算并不复杂,但蕴含着深刻的含义。有时,先验概率很容易得到,但对于不同条件的概率,其计算难度差别很大。比如医生可以在心脏病人中统计男女占比,但很少会在只知道对方性别的情况下诊断对方得心脏病的概率。
另外,根据贝叶斯公式,先验概率一般是由以往的数据分析或统计得到的概率数据。后验概率是在某些条件下发生的概率,是在得到信息之后再重新加以修正的概率。也就是说,后验概率可以在先验概率的基础上进行修并得到。
(读书备注来源:微信公众号“大数据DT”)