以往的经验将两个折中的想法不知不觉地渗入到了我们的处事方法中,我们甚至不再把这当成一种折中,而是把它当成了事务的自然状态。
第一个折中是,我们默认自己不能使用更多的数据,所以我们就不会去使用更多的数据。但是,数据量的限制正在逐渐消失,而且通过无限接近“抽样=总体”的方式来处理数据,我们会获得极大的好处。
第二个折中出现在数据的质量上。在“小数据”时代,追求精度是合理的。因为当时我们收集到的数据很少,所以需要越精确越好。如今这依然适用于一些事情。但是对于需要快速获得脉络轮廓和发展趋势的情景,严格的精确性就没有那么必要了。
就像把一首数码歌曲截取成多个小文件相似,在采样分析的时候,很多信息就丢失了——你能欣赏一首歌曲的抽样吗?拥有全部或几乎全部的数据,我们就能够从不同的角度,更细致地观察和研究。
“大数据”不用随机分析法这样的捷径,而采用对所有数据分析的方法。数据多比少好,更多数据比算法系统更智能还要重要。