前面说到了人类的思维从找到事物因果联系的确定性的机械性思维,到发现世界是不确定性的思维模式是巨大的进步。这里我们也应该审视一下自己的思维,毕竟我们很愿意相信具有因果必然的逻辑,可是正因为世界已经变得复杂,变量条件也不断增加,接受不确定性反而是好的策略。这里我们要知道阿尔法go在和李世石下棋的时候每走一步是计算获胜的概率,仅此而已,它并不是能准确预测对手的下一步棋,而是根据每一步棋做出最好的安排,也就是针对不确定性做的最好的选择。
这里得提到一位堪比牛顿的人物—香农。说实话我在读这本书之前是不知道的,他的贡献是把事物的不确定度和信息联系在一起,简单的说就是如果我们要搞懂一件不清楚或者不确定的事情,就需要了解大量的信息。换句话说你如果想消除不确定性,就得有大量的信息。注意这里的信息质量要求是很高的,面对重复一万遍的信息并没有解决问题的价值。所以我们要获取的信息往往是多层次和多维度的。而且我们理解各种信息的不再仅仅用因果理解,更多的是用信息的相关性。例如我们预测天气,收集各个时刻大气运动的状态,云层含水量,环境温度湿度等就有目的性,也就是信息之间的关联性很高,如果预测天气要收集了人们出门带不带伞这个信息恐怕就无法预测了。这里我们并没有要解释哪个因素一定会导致下雨,它是多种条件,多个变量共同作用的结果,而我们是找出与之关联度较高的信息加以整合。
说到这里你是否发现了大数据带来的一个思维转变呢,即我们对因果的探求转变成了对各种信息关联的探求,从这个意义上看goole是一家超级数据公司。它不知道我们下一刻到底要搜索什么关键字,但是它利用数据给出和各种关键字关联度高的结果和网页。如果它仍然要去分析我们搜索行为背后的原因,恐怕会陷入疲劳战。还记得之前我说过的亚马逊发邮件的情形吗?它在分析我们的数据给出与之关联度高的商品推荐给我们,而不用知道为什么这些商品关联度高。换句话说他们是从答案中找答案。写到这里,希望你对大数据的特征有了进一步的了解,当然了自己去看看《智能时代》会接触到更多的例子,下次我们继续。