数据——人类建造文明的基石
数据的范畴远比我们通常想象的要广得多。人类认识自然的过程,科学实践的过程,以及在经济、社会领域的行为,总是伴随着数据的使用。从某种程度上讲,获得和利用数据的水平反映出文明的水平。
在电子计算机诞生、人类进入信息时代之后,数据的作用越来越明显,数据驱动方法开始被普遍采用。如果我们把资本和机械动能作为大航海时代以来全球近代化的推动力那么数据将成为下一次技术革命和社会变革的核心动力。
接下来,我们将在这样一个高度上来理解大数据,以及由它带来的全球智能革命。
思维的革命
在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心。
在方法论的层面,大数据是一种全新的思维方式。但如果我们要想在“道”的层面了解大数据,了解一种新的思维方式的重要性,而不仅仅是将自己的追求停留在“术”的层面,那么我们就需要了解人类认识世界方法的演变和发展过程。
相对于思维方式和方法远不如方法论对科学的发展至关重要,东方的文明长期以来在技术上领先于西方,但是在科学体系的建立上远远落后于西方,关键是输在方法论上。
在古希腊罗马以后,人类对自然界的认识进步非常缓慢,西方进入了中世纪的黑暗时代。东方的中国和阿拉伯帝国虽然在工程和技术上不断进步,但是既没有形成科学体系,也没有在方法论方面做出太多的贡献。
最终,发展科学方法的任务留给了笛卡尔和牛顿。笛卡尔的贡献在于提出了科学的方法论,即大胆假设,小心求证,这个方法论在我们今天的工作中还在使用。不过对近代社会思想贡献最大的还是著名科学家和思想家牛顿。
从欧几里得到托勒密再到牛顿,在思想方法上可以说是一脉相承而又不断发展的。牛顿不仅把欧几里得通过逻辑推理建立起一个科学体系的方法论从数学扩展到自然科学领域,而且把托勒密用机械运动模型描述天体的规律,扩展到对世界任何规律的描述。后来人们将牛顿的方法论概括为机械思维,其核心思想可以概括成这样几句话:
第一,世界变化的规律是确定性,这一点从托勒密到牛顿大家都认可。
第二,因为有确定性做保障,因此规律不仅是可以被认识的,而且可以用简单的公式或语言描述清楚。
第三,这些规律应该是放之四海而皆准的,可以应用到各种未知领域指导实践的,这种认识是在牛顿之后才有的。这些其实就是机械思维中积极的本质。
机械思维直接带来工业大发明的时代。机械思维的重要特征——所有问题有一个通用的解决方法。机械的广泛使用和机械的思维方式直接导致了人类迄今为止最为伟大的事件——工业革命。马克思曾用这样的一句话来形容工业革命的影响力,讲到:“资产阶级在其不到100年的阶级统治中所创造的生产力,比过去一切时代创造的全部生产力还要多,还要大。”工业革命带来的不仅是财富,也大大延长了人类的寿命。
机械思维更广泛的影响力是作为一种准则指导人们的行为,其核心思想可以概括成确定性(或者可预测性)和因果关系。而机械思维的局限性更多来源于它否认不确定性和不可知性。
在信息时代来临之时,谁掌握了信息,谁就能够获取财富,这就如同在工业时代,谁掌握了资本谁就能获取财富一样。学会用不确定性这种眼光看待世界,再用信息消除不确定性,不仅能够赚钱,而且能够把很多智能型的问题转化成信息处理的问题,具体说,就是利用信息来消除不确定性的问题。
时下信息的爆炸式增长源于信道容量的扩大,但信息的传播速率不可能超过信道的容量。运用这个规律,能够解释很多商业行为。比如我们常说做生意要靠人脉,其实这个人脉就是人与人交往的带宽。如果人脉不够,发出的信息和获得的信息都有限,生意一定做不大。
现代通信手段的本质,就是以相对低廉的成本让人们获得人脉,而媒体行业的不断进步,本质上是不断地在为企业拓宽对外连接的带宽,使得它们做生意越来越方便。
很多时候,落后与先进的差距,不是购买一些机器或者引进一些技术就能够弥补的,落后最可怕的地方是思维方式的落后。西方在近代走在了世界前列,很大程度上靠的是思维方式全面领先。大数据思维和原有机械思维并非完全对立,它更多的是对后者的补充。在新的时代,一定需要新的方法论,也一定会产生新的方法论。
科学技术的发展并非是匀速的。重大的科技突破常常需要酝酿很长的时间,在这段时间里,我们发现技术进步是一个缓慢的量的积累,有人把它称为相对停顿的状态,因为这个阶段一切发展都是平衡的。但是当这些量的积累到一定程度后,科技在段时间内获得单点突破,然后新科技全面迸发,这便是拐点。
在历史上有很多关键性的拐点,比如1666年,牛顿发明了微积分,发现了力学三定律和万有引力定律,完成了光学分析,从此世界进入科学近代社会,因此这一年被看成是科学史上的一个拐点。
到1905年,爱因斯坦完成了分子说,发现了光电效应,提出了狭义相对论,从此开启科学的现代社会,随后物理学的各个领域全面繁荣。
1965年,摩尔定律提出了摩尔定律,同时在工业界大规律集成电路出现,从此开始了持续半个世纪的信息产业高速发展。在这些拐点上,原有的平衡被迅速打破,人类从此进入一个新的时代。
大数据在今天这个时间点爆发,是各种技术条件具备的结果。但是,要让大数据真正发挥巨大作用,让计算机变得更聪明,还有很多技术挑战需要应对。
大数据的数据量大、维度多、数据完备等特点。使得它从收集开始,到存储和处理,再到应用,都与过去的数据方法有很大的不同。因此,使用好大数据也需要在技术和工程上采用与过去不同的方法,尤其是要改变我们过去的很多思维定式。在今后,任何一个能够提供某些大数据关键技术的公司和个人,在未来的智能革命中,都将有大展宏图的机会。
未来的智能化产业,会因现有产业+机器智能=新产业,而催生未来的农业、制造业、体育、医疗、律师,编辑记者行业迎来崭新形态,新产业将取代旧产业满足人类的个性化需求,大数据将导致我们整个社会的升级和变迁。
NBA勇士队能在短短几年从一个倒数的球队晋升为总冠军,其逆袭的根源在于它位子美国的高科技基地——硅谷。而硅谷地区有两种人最不缺,即风险投资人和工程师,勇士队的奇迹从很大程度上讲是靠他们创造的,前者善于看到其他人还没有发现的投资潜力,然后把它经营成值钱的实业;后者善于利用技术创造奇迹。勇士队的成功就是他们合作的结果。
大数据对体育训练的帮助还在于分析和总结优秀选手的动作姿态,纠正其他运动员的动作。今天高尔夫球运动员和网球运动员会在身上安装各种传感器,测定动作,然后和优秀选手的动作比对,纠正自己的动作。可以预见,未来的竞技体育是离不开大数据和机器智能的。
2011年德国提出工业4.0的概念,即通过数字化和智能化来提升制造业的水平。相应地,中国也提出了中国制造2025的概念,其核心是通过智能机器、大数据分析来帮助工人甚至取代工人,实现制造业的全面智能化。
在美国,特斯拉汽车公司已经尝试全部使用机器人来装配汽车,这不仅使得工厂雇佣工人的数量大幅度减少,而且还让出厂的汽车性能和质量更稳定。
特斯拉其实在悄无声息地重新定义汽车行业,它对汽车的理解已经和当年的福特或者奔驰完全不同了。汽车这个老行业,在引入大数据和机器智能之后就脱胎换骨,变成了一个新的行业。
特斯拉只是未来制造业一个典型的案例,其他商品的制造和流通也可以得益于大数据和机器智能。当机器智能逐步渗入到商品制造和销售的各个环节时,不仅工人的数量将逐渐减少,而且整个制造业都将被重新洗牌。
大数据和机器智能将重塑未来医疗。引入大数据,降低了医疗漏判率,其随着病例的增加准确率也会提高得非常快。而机器智能比人的稳定好,不会像人那样受情绪的影响,这些智能程序的成本,通常不到人工的百分之一,这将会大幅缩减医疗成本和解决医疗资源短缺的问题。
大数据思维其实已经在改变司法领域的工作方式,诉讼的一方会通过数据之间的强相关性寻找证据,而司法领域也认可这一类证据。大数据对司法领域的另一个重大影响在于机器智能会逐渐取代律师做一些案例分析工作,这使得诉讼的成本有可能大幅度下降。
大数据的介入,使得一些科技公司发明了一种处理法律文件的自然语言处理软件,使得律师的效率可以提高500倍,而打官司的成本可以下降99%,这意味着未来将有相当多的律师(尤其是初级水平的律师)可能失去工作。
计算机写作大大提高了新闻行业的效率,但是同时也让记者和编辑这类工作正在萎缩。或许再过若干年,我们在编辑部里看到的景象不再是一批伏案工作的编辑,而是一台台计算机,这个行业也就被重新定义了。
大数据将导致我们社会的产业升级和变迁。不过,如果对比每一次产业革命前后产业的变化,你就会发现其实人类很多基本的需求并没有变,只是采用了新技术后,新产业会取代旧产业满足人类的需求。在技术革命中,固守旧产业是没有出路的。
机器智能会给人类带来一个终极问题:既然什么事情都可以让机器来做,而且还比人做得好,那么人类怎么办?
技术对社会带来的影响有时候非常诡异。一方面它可以改善人们的生活。延长人类的寿命,让一些处在新的行业、掌握了新的技能的人发挥更大的作用;另一方面则可能让更多的人无事可做。智能革命则必然如此,当计算机变得足够聪明之后,一定会取代人类完成很多需要高智力的工作。
历史上影响力可以和正在进行的智能革命相比的,只有19世纪末始于英国的工业革命、20世纪末始于美国和德国的第二次工业革命、“二战”后以摩尔定律为标准的信息革命,一共三次。这三次技术革命都有一个共同的特点,那就是它们对当时的社会产生了巨大的冲击,都需要经过大约半个世纪甚至更长的时间才能消化掉。
在每一个重大的技术革命开始的时候,真正勇敢地投身到技术革命大潮中的人毕竟是少数,受益者更少,大部分人则会犹豫和观望。在智能革命到来之际,每个人则有两个选择,要么加入到这一次浪潮中,要么观望徘徊,最后被淘汰。
当然,大多数人的观望、犹豫和徘徊,给了2%的人以机会,使得愿意吃螃蟹的人在奋斗的道路上少了很多竞争对手。正是因为知道自己不加入进来就会被淘汰,马斯克和盖茨一方面对机器智能的发展非常担心,另一方面却选择加入到机器智能的大潮中。
大数据导致机器革命的到来,这对未来社会的影响不仅仅存在于经济领域,而是全方位的。尽管总体上这些影响是正面的,从长远看会使我们未来的社会变得更好;不过,和以往的技术革命一样,智能革命也会带来很多负面的影响,特别是在它发展的初期,而这些影响可能会持续很久。
任何一次技术革命,最初受益的都是发展它、使用它的人,而远离它、拒绝接受它的人,在很长的时间里都将是迷茫的一代。
在智能革命到来之际,作为人和企业无疑应该拥抱它,让自己成为那2%的受益者;而作为国家,则需要未雨绸缪,争取不要像过去那样每一次重大的技术革命都伴随半个多世纪的动荡。
我们还没有经历过机器在智能上全面超越人类的时代,我们需要在这样的环境里学会生存。这将是一个让我们振奋的时代,也是一个给我们带来空前挑战的时代。
——来自《智能时代:大数据与智能革命重新定义未来》的读书笔记