我们生活的21世纪,是一个大数据时代,淘宝网会根据我们的浏览记录和购物记录,进行计算,推送我们可能喜欢的东西;浏览器推送也是如此,根据我们的浏览停留时间进行预测。塔吉特公司营销分析小组建立统计学模型,基于采购数据,能准确推断其中一位顾客怀孕了。是否真的是相关数据越多,越精确,预测的准确度越高啦?
作者举例天气预报,奈飞公司编写向顾客推荐影片的算法,推翻这一论断。然而大数据计算也是有意义的:
戴帽子的猫与学校里最不讲卫生的人
例子:朋友每天都穿同样印有戴帽子的猫喝啤酒图案的T恤,周围的人都认为他是学校里最不讲卫生的人。
其实他是每天都穿的是新T恤,只是每件都长得一样。出现这个现象的原因是他们只考虑了两种假设。P161页
福尔摩斯的座右铭并不全面,应该在后面加一句,除非它是你没有考虑到的那个假设。这告诉我们,对一个现象不要妄下结论,可能你只是没有考虑到其他假设和可能性。好比对待学生。