这本书每一章节似乎都给我欣喜的颠覆。
我们在数据采集的过程中,尤其广泛的数据采集时,都习惯性的先做一次预处理。预处理的实质就是筛选,删除那些看起来对我们的分析报告没有帮助的数据,留下那些确切的能指导结果的数据。传统意义上来讲,这样并没有错误,我们用精准的数据才能做出精准的分析。
但事实上,我们失去了一种可能性,一种看破全局的可能性。我们对数据精准的苛刻,某种意义上是把我们困在了一个框框里。有句古诗是这样的,不识庐山真面目,只缘身在此山中。精准把我们困在了山中,失去了欣赏整座山的机会。
因为对错误的宽容,谷歌的翻译系统战胜了IBM的Candide,也给我们带来了翻译快捷方便的极致体验;因为对混杂数据的宽容收录,ZestFinance对偶然事件的关联分析更加精准的判断个人的信用记录,大幅降低了银行贷款的拖欠率。
不得不承认,大数据时代,宽容错误会给我们带来更多价值。