吴军老师的书一如既往的深入浅出,读起来爱不释手。今天白天参加公司的Big Data Day 活动意犹未尽,下班读《智能时代》,真是把大数据的本质写得非常透彻。
一般的大数据相关的书籍一般着眼于大数据的特点和作用。吴军老师从更高的视角看待大数据,指出大数据是智能时代的钥匙。在智能时代以前是机器时代,以工业革命为机器时代的顶峰。机器时代的方法论的核心思想是要想得到结果,必须知道原因,然后找到解决办法。以发现青霉素的过程为例,最初发现某些霉菌有杀菌的功效,继而研究出里面的有效成分是青霉素,之后研究出青霉素的化学成分,并人工制造出来。这种办法有效,但是往往周期长。相对于现代医学,传统中医并不知道科学的原理,但是知道相关关系,即病症对应的药方,同样可以解决问题。
机器时代的思路是弄清楚事情的原理,并据此找到解决问题的办法。但是这种思路的前提是食物是确定型的,而现实世界并不全是确定的。有很多的不确定的事情,一类是因为有很多的隐含的因素没有考虑到,还有一类是食物本身就是不确定的,比如微观世界的运动。
相对于这种不确定的问题,解决的核心思路是把智能问题转化为数据问题。通过把不确定问题转化为概率问题而找到解决方法。这种方法一般是用相对简单的模型,辅助以大量的数据去优化参数,所谓的机器学习。这种方式的前提是需要满足数据量足够大,数据完备性足够强。否则容易出现黑天鹅事件。从而达到量变引起质变的效果。比如语音识别,机器翻译都是采用了这样的方式实现了成功。把这类问题看成是通信问题,即对给定的信源S,识别成T的概率最大者胜出。围棋也是类似的,在当前的状态,怎么走能够实现胜率最大。
这本书还没有读完,但是读到我可以肯定这是一本值得收藏的好书,推荐给大家。