农业
在引入机器智能之后,农业这个人 类最古老的产业将会以崭新的形态出 现,它将验证“现有产业+机器智能=新 产业”这样一个已被证明的技术革命进 步的规律。
体育
就在一次大数据会议(TUCON 2012) 上介绍了该球队应用大数据的成果。根 据威尔茨的介绍,大数据可以帮助球队 改进精细到两个人配合的细节。正是靠 高科技,勇士队才得以在短短6年里从倒 数第二名登顶NBA的总冠军。
鉴于勇士队的战术和成绩给NBA带 来的巨大冲击,奥巴马在白宫专门接见 了勇士队,并且讲道:“(这)看起来正 在打破这项运动的格局,这似乎是不公 平的比赛。”篮球界的人士则认为,勇士 队是 NBAM 的Google。
利用数据提高球队整体运动成绩的 想法并非今天才有,20世纪80年代,与 中国女排同时崛起的还有美国女排。与 中国队主要靠技战术水平和女排精神所不同的是,美国女排的秘密武器是高速 摄像机和统计。也是美国女排的运气不 好,遇上了在巅峰状态的中国队,接连几 次世界大赛都和冠军失之交臂。
过去由 于数据量有限,统计作用不是非常明显, 因此在体育中利用数据指导训练的情况 并不普遍,但是在未来,大数据一定会改 变体育界的格局。
大数据对体育训练的帮助还在于分 析和总结优秀选手的动作姿势,纠正其 他运动员的动作。
今天高尔夫球运动员 和网球运动员会在身上安装各种传感 器,测定动作,然后和优秀选手的动作比 对,纠正自己的动作。机器智能对体育的帮助,还体现在 计算机可以训练棋牌选手。
今天,很多国际象棋学校在训练小棋手时,使用的是 计算机而不是真人教练。近年来,计算机 也开始训练围棋选手了。
可以预见,未来的竞技体育是离不 开大数据和机器智能的。体育依然会是 人类最喜爱的娱乐活动,但是仅靠天赋 和苦练将不足以取得最好的成绩。
汽车
2011年德国提出工业4.0的概念, 即通过数字化和智能化来提升制造业的 水平。相应地,中国也提出了中国制造 2025的概念,其核心是通过智能机器、 大数据分析来帮助工人甚至取代工人, 实现制造业的全面智能化。
在美国,特斯 拉汽车公司已经尝试全部使用机器人来 装配汽车,这不仅使得工厂雇用工人的 数量大幅度减少,而且还让出厂的汽车 性能和质量更稳定。
曾几何时,产业工人的数量被看成 是制造业竞争力的重要标志,大量低工 资的生产线上的工人造就了全球制造业 的繁荣。被称为“世界工厂”的中国在改 革开放以后正是靠这一项核心竞争力跻身世界制造业大国行列。
美国“二战”后的汽车行业有上百万装配工人,但是现在只剩下当年的一个 零头。而新的汽车公司比如特斯拉,已开 始尽可能地使用机器人取代装配工人。 硅谷东部的弗利芒特市(Fremont)有特 斯拉最大的汽车装配厂。事实 上,在过去的5年里,特斯拉员工数量增 长非常快,不过它所雇的都是IT人员,以 至于它更像是一个IT公司而非汽车公 司。那么大家可能有一个疑问,特斯拉的 汽车是怎么制造出来的呢?答案很简单, 尽可能地使用机器人。
机器人取代人类从事制造业的另一 个巨大优势在于,产品很容易按照个性 化定制。在大工业时代,机器所解决的是 确定性问题,因此,一旦一个产品设计出 来,它就是确定的,按照事先确定的设计 复制,成本是很低的。但是,如果哪个顾客想要根据自己的需求订购一款特定的 产品,那么成本是很高的。而在机器人取 代生产线上的装配工人的智能制造时 代,只要通过设定产品参数,机器人就可 以根据用户需求制造出个性化的产品, 其成本不会比大规模生产高多少。
特斯拉很少雇用原来汽车行业的人 员,除了降低成本外,还有一个更深层次 的原因是它一直把自己定位成一个IT 公司,而不是汽车公司。
汽车其实就是承 载着特斯拉IT技术的平台,特斯拉内部 将汽车看成是一个巨大的智能终端,通 过这个智能终端,特斯拉把它的各种技 术服务提供给大家,同时也参与到消费 者的曰常生活中,这和我们在前面提到的小米手机有不少相似之处。
特斯拉颠覆现有汽车行业所做的另 一件事,就是取消存在了一个世纪的汽车代理商制度。为什么特斯拉能够做到这一点,而比它更大的、更有话语权的那 些大牌汽车公司却不得不分利给各地的代理商呢?
这就要从产品生产和流通的 产业链说起。产品生产本身只是商品经济中几个 主要环节中的一个。除了生产,商品的设 计和研发、仓储和物资管理、物流和运 输、ftt发和零售,在过去都是不可或缺的 环节。
我在《浪潮之巅》中介绍过戴尔的 商业模式,它的成功在于一方面出让了最需要人力的生产环节,以降低成本,另 一方面依然牢牢把控着其他重要的环 节,以保证利润。过去,在生产以外的环 节,要么需要所谓知识型的员工来完成,要么需要本地的员工。比如汽车的销售 在过去依靠的就是本地员工,如果由汽 车厂直接在销售地雇人,成本会比交给 代理商更高。
但是到了大数据时代,除了 商品的设计和研发,剩下的环节要么高 度智能化(比如仓储和物资管理),要么 干脆被砍掉(比如批发行业),因此在制 造业中那些所谓高端的工作也面临着被 机器智能所取代。比如阿里巴巴的崛起, 就让很多批发行业的工作从此消失了, 当然,同时也带来了全社会效率的提升。
戴尔公司从早期直到2004年的成 功原因在于,它率先采用智能化的管理 降低了各个环节的成本。但是,当联想等 很多企业也采用类似的管理方式时,靠 低成本竞争的戴尔就不再具有优势了。
特斯拉则比戴尔更进了一步,它除了大量雇人研发汽车的各种新功能外,还从 设计开始,直到汽车送到顾客手上,加上 售后服务,这中间各个环节里尽可能地 采用计算机而不是人来工作。
因此,特斯 拉才能够做到所有事情都由自己来做, 因为计算机帮了它的忙。特斯拉其实在悄无声息地重新定义 汽车行业,它对汽车的理解已经和当年 的福特或者奔驰完全不同了。汽车这个 老行业,在引入大数据和机器智能之后 就脱胎换骨,变成了一个新的行业。
特斯拉只是未来制造业一个典型的 案例,其他商品的制造和流通也可以得 益于大数据和机器智能。当机器智能逐 步渗入到商品制造和销售的各个环节 时,不仅工人的数量将逐渐减少,而且整个制造业都将被重新洗牌。仅仅靠降低 工人工资的低水平竞争将不再具有制造 业方面的优势,因为它在未来的竞争要 靠从设计到销售全过程的智能化水平。
医疗
医疗保健在任何发达国家都是一个 大产业,甚至是最大的产业,因为人类发 展经济和科技最重要的目的就是增进健 康、延年益寿。在历史上,历次重大科技 进步都伴随着人类医疗保健水平的飞 跃。
在工业革命之后,人类搞清楚了细菌 致病的原理,并且通过科学的方法完成 了传统医学到现代医学的转变。
在第二 次工业革命之后,人类发明了抗生素,我 们在前面讲到,抗生素的发明过程是自 觉应用机械思维的结果。“二战”后,随着信息革命的开展,各种诊断仪器和治 疗仪器被发明出来,包括今天常用的CT (计算机体层摄影)扫描仪、核磁共振机、 心脏起搏器和进行各种微创手术的仪器。
毫无疑问,大数据和机器智能也将对 未来的医疗产生全面而重大的影响。
相比医生,计算机在诊断和做手术 等方面有三大优势:首先,它们漏判(或 者失误)的可能性非常低,也就是说它们 能够发现一些医生们忽略的情况;其次, 它们的准确率很高,而且随着数据量(病 例)的增加提高得非常快;最后,也是人 所不具备的,这些智能程序的稳定性非 常好,它们不会像人那样受情绪的影响。 而这些智能程序的成本,通常不到人工的百分之一。
目前,如果不引 入医师的干预,仅仅靠计算机通过阅读 病例、倾听病人的描述和分析化验结果 进行疾病诊断,它也能达到中等医生水 平。虽然这样的水平远没有达到取代医 生的程度,而且在医疗资源较多的大城 市里必要性不大,但是在缺少医生的非 洲和印度,有这种“机器医生,’总比没有 强。何况,考虑到医疗数据增长很快[14 ],计算机学习能力又很强,这一类系统会进步非常快,可以预见在不久的将来, 计算机在一些疾病的诊断方面会超过 人。
律师
我们在前面讲到的大数据思维其实 已经在改变司法领域的工作方式,诉讼 的一方会通过数据之间的强相关性寻找 证据,而司法领域也认可这一类证据。大 数据对司法领域的另一个重大影响在于 机器智能会逐渐取代律师做一些案例分 析工作,这使得诉讼的成本有可能大幅 度下降。
与医生类似,律师过去在发达国家 也被认为是最“高大上”的职业。由于打 官司的过程长、费用高,而且法庭的判罚 常常带有惩罚性质(而不是简单的赔偿 性质),因此律师的工作显得特别重要, 而诉讼双方付出的律师费用也高得惊 人。
在美国打官司,律师费用高昂的原因有 很多,其中最重要的一个是英美法系是 判例型法律体系(又称海洋法系),打一 场大官司,需要将历史上相关的官司法 律文件都拿出来分析,这个工作量巨大。 像Google和Viacom之间的官司,需要分析上百万份历史文挡。
到了大数据时代,这个情况会慢慢 得到改变。今天,一些公司利用自然语言 处理和信息检索技术,发明了让计算机 阅读和分析法律文献的软件,可以取代 很多人工。
位于硅谷帕罗奥图市的 Blackstone Discovery (黑石发现)公 司发明了一种处理法律文件的自然语言 处理软件,使得律师的效率可以提高500 倍,而打官司的成本可以下降99%,这意味着未来将有相当多的律师(尤其是初 级水平的律师)可能失去工作。
事实上这 件事情在美国已经发生,新毕业的法学 院学生找到正式工作的时间比以前长了很多。
记者和编辑
如果我们把计算机分析案卷和病例 看成是一种阅读行为,那么今天的计算 机已经发展到不仅能读,而且还能写作 了。
其实计算机在自动回答问题时,就已 经具有了简单的写作本领,因为计算机 回答问题的最后一个步骤就是将知识的 片段写成优美的文字段落。当然,在回答 问题时,所需要写的只是简单的段落而 非完整的文章。
今天计算机写作的本领到底有多 大?我们可以把写作从简单到复杂分为 下面5个层次:
1.书写完整的句子。
2.组织几个句子构成符合逻辑的段落。
3. 给予特定格式,或者写作模板, 能够清晰传递信息,表达意思。
4. 能够不限定格式地写作内容,达 到一般人平均水平。
5. 能够达到专业记者、作家和学者 水平。
在组织构造问题答案时,计算机已 经达到了第二层次。实际上目前计算机 的写作水平比这个层次还高一点,它能 够完成结构比较清晰、格式固定的新闻 稿,因此基本上达到了第三个层次的要 求。
计算机是如何写作的?
实际上它的 写作方式和我们人在学习外语时造句的 方法完全不同。它不是根据语法和所要 表达的意思编句子,而是从大量文本语 料中学习写作。我们常用“熟读唐诗三百 首,不会作诗也会吟”说明背诵过去的范 文对写作的帮助,而计算机的长处恰怡 在于它能够背,而且能够快速读非常多 的样本并背下来。
计算机写财经评论其 实是根据以前很多报纸上多年积累的财 经类的文章,训练出各类财经文章的模板,然后每次根据从财报中读出的信息, 合成一篇文章。
当然,这样合成的文章读 起来未免生硬,因此计算机还要用一种 被称为语言模型[20 ]的概率模型,将文 字构造成优美的句子,再用另一个语言 模型将句子组合成段落。这些模型也是 从以往的数据中训练出来的。
当然,像 《华尔街日报》或者《纽约时报》这样的 大报在发稿前还会让编辑润色文字,而 一些网络媒体常常将计算机写的财经文 章直接就登了出去。计算机写作大大提高了新闻行业的效率,但是同时也让记 者和编辑这类工作正在萎缩。
或许再过 若干年,我们在编辑部里看到的景象不 再是一批伏案工作的编辑,而是一台台 计算机,这个行业也就被重新定义了。
小结
大数据将导致我们社会的产业升级 和变迀。不过,如果对比每一次产业革命 前后产业的变化,你就会发现其实人类 很多基本的需求并没有变,只是采用了 新技术后,新产业会取代旧产业满足人 类的需求。
在技术革命时,固守旧产业是 没有出路的。机器智能会给人类带来一个终极问 题:既然什么事情都可以让机器来做,而 且还比人做得好,那么人类怎么办?
我们 将在下一章中重点讨论这个问题。
智能化社会
智能化社会表现在整个社会从宏观 到微观的各个层面,在这一小节,我们先 来关注宏观层面的变化。大数据和机器 智能将把我们社会的管理水平提升到一 个前所未有的高度,使我们生活的环境 更加安全。
今天,世界上主要的大都市都已经 没有了大规模扩建街道的可能性,但是 其中大部分大都市的人口还在增加,流 动人口也越来越多,因此除了更聪明地 在时间和空间上利用好现有的道路,别 无他法。
X团队目前和美国4个大型城市合 作,试用了该系统,结果表明使用者每天 可以节省20分钟左右的通勤时间。不要 小看这20分钟时间,如果像北京这样的 大都市每人每天能在通勤上节省20分钟 时间,社会效益是非常可观的。
智能社会体现在方方面面,但概括 起来,就是让我们的生活变得更加方便,同时社会资源的利用率极大地提高。要 做到这一点,重要的是让整个社会精细 化。
精细化社会
我们在第四章中介绍了大数据在商 业应用中的两个方向。从每一个局部汇 集到整体时,我们能够掌握全局,实现社 会的智能化。而当数据再从整体流向每 一个细节时,我们可以让未来的社会变 成一个精细化的社会。
为了说明这一点, 我们不妨先看看通过区块链(Block Chain),在未来如何跟踪每一件商品从 制造出来直到被消费的完整行踪。
区块链由两个英文单词Block和 Chain组成,顾名思义,它应该包含两个 方面的意思:Block即模块、单元的意思, 它像一个账户存储信息;Chain是链条的 意思,即表示一连串的交易;交易的细节 就存在Block中。比特币实际上是一个由 随机数算法产生的随机数,这个随机数 在整个互联网上是唯_的,而且是可以 验证其真伪的。
比特币在被挖矿者挖出 来时,就产生一个带有这样特殊随机数的Block,当这个比特币通过交易转到第 二个人手里时,在该Block中就记录下了 交易的信息,这个过程本质上是一个加 密的信息传输过程。一旦交易完成,它就 被通知到整个互联网上,大家就知道相 应的比特帀的拥有者改变了。所有比特 币散布在整个互联网中,
通过公开密钥 来发送和传播,拥有者和交易的过程都 是匿名的,而且没有一个中心能够集中 控制,因此特别适合洗钱。
既然比特币的这种区块链可以记录 钱的交易,那么也应该能记录其他的交 易和传输。如果在每一件商品制造出来 时(或者出厂时)产生这样一个区块链, 并且在它被运输和交易时利用区块链记 录全过程,那么这个商品整个的流通过 程就是可追踪的。
当最终的消费者(顾 客)购买这个商品后,他可以看到这个产 品是如何从出厂开始一步步卖到自己手上的。
这样,从理论上讲可以杜绝假货,因为区块链和商品是一一对应的,既然 不可能产生两个相同的区块链,也就不 可能复制同一个商品。
类似地,厂家也可 以了解到它每一件商品是怎样流通到最 终消费者手里的。
其实,今天大家用药和就诊这件事 透露出工业时代的一个特征,就是一切 标准化。在工业革命开始以前,人类使用 的产品、享受的服务都有细微的差别,当 然这样效率很低。在近代医学开始之前, 每一个人的用药都是不同的,尽管那种 差异未必有科学根据。
工业化的一个结 果,就是靠批量生产的效率让个性化从 大众市场消失了,不仅产品是标准化的, 服务也是如此。
比如在医疗方面,美国医 生协会要求每一个从业者遵守流程。对医院来讲,医生宁可治不好病,也不能违 背流程,因为如果违背流程引起官司,医 院的损失可能是巨大的。虽然不能说标 准化的产品和服务不好,但在很多情况 下对顾客肯定不是最优化的。
然而,在工 业社会里,要获得个性化的产品和服务 成本太高,除了个别富人愿意花非常高 的代价去享受这样的产品和服务,一般 人是享受不到的。在大多数产品和服务 都被标准化的时代,大家很难找到最适 合自己的,只能默认最权威的或者最贵的就是最好的。
这也是大家在就诊时普 遍认定教授比副教授好,副教授比主治 医生好的原因。到了智能时代,机器的智能水平足 以为我们提供各种个性化的服务,同时 能够做到成本和过去的标准化服务相 当。
这使得我们在今后可以享受到个性 化为我们带来的生活的巨大改善,那是 今天所谓富有的上层人士才能享受到的 生活。
因此,大数据和机器智能可以让我 们整体的社会环境乃至文明程度都有质 的飞跃。但是,在另一方面,大数据也会给未来社会带来巨大的冲击。
无隐私的社会
到目前为止,我们一直在讲的是大 数据和智能革命对社会、对我们的生活 所带来的正面影响。但是任何事情一定 都有两面性,大数据和智能革命对未来 社会的冲击也是不能小视的,我们或许 会生活在一个没有隐私的环境里,或许会被一些超级权力在无形中控制,甚至 很多人因为没有掌握未来生存的技能而 找不到工作,财富可能会更加集中在少数人手里。
根据历史的经验,这些问题是 无法回避的,而且也不存在快速的解决 方法。让我们先来看看大数据和机器智 能对于个人隐私的影响。
虽然媒体在谈到隐私时常常讲的都 是一些个人不愿为大众所知的信息,比 如私密的图片或者银行账号的密码,但 是这里我们所讲的是一个非常广泛的概 念,涉及我们生活的方方面面。
比如在前 面提到的最近是否必须到某城市出差这 样的信息,个人性格是软弱还是强悍,学 历的高低和收入的多少,这些都是我们 的隐私。私密的图片流出去会让我们难 堪,银行账户密码丟了会让我们蒙受经 济上的损失,这些损失是看得见的,我们 因此非常在意,也就或多或少地有所防 范。但是,关于我们生活方方面面的细节 隐私,我们常常很不在意,也不加以保护。
这些生活细节的隐私泄露出去会发 生什么事?简单地讲,将来可能很麻烦。 这不仅仅是在淘宝上总被送来一些假 货,或者买机票总是比别人贵20%那么 简单。
它可能涉及我们的健康和医疗,可 能没有医院会接收我们住院。每一个人从小到老生 病的规律性。比如我们知道得了丙型肝 炎,即使暂时治愈,还是有很大的可能性在若干年后转成肝硬化,然后又有很大 的可能性变成肝癌。其他很多疾病也有 这样的关联关系。
但是,研究成果如果让医疗保险公司 使用,那么它们就有权利拒绝接受一位 未来可能得重病的投保者。美国各大保 险公司实际上掌握着投保人过去多年的 身体状况信息,因为医生每一次向保险 公司索要医疗费时,都会提供这些信息。
在过去,由于机器智能的水平不高,这些 事没法做,保险公司_般对投保者一律接受,但是在法律上,它们有拒绝投保人 的权利。
在移动互联 网时代,尤其是今后万物联网的时代,我 们本身就是主动的隐私泄密者。绝大部 分智能手机的使用者安装了太多的、很 少使用甚至并不必要的APP,参加了太 多的优惠促销活动。
同时,在自认为安全 的社交网络说了很多在公众场合不适合说的话,或者发了太多的照片。这些都可 能造成人为的隐私泄露。
今天很多人忽视大数据对个人隐私 潜在的威胁,原因至少有以下三个:
首先 是对这个问题缺乏认识,他们并不知道 大数据的威力,不知道多维度的信息凑 到一起能够得到一个人完整的画像。
其次是低估了机器智能的力量。
很多人认 为,虽然某个公司即使有了关于我的很 多数据,但是那些数据都是杂乱无章的, 该公司哪有工夫专门和我这个小人物过 不去。岂不知在机器智能时代,挖掘个人隐私并不需要人来做,而是由机器完成的。
最后,也是最重要的原因,就是很多 人一厢情愿地把个人隐私寄托在数据拥 有者的善意上。
虽然到目前 为止,Facebook、 腾讯和阿里巴巴这些 实际上已经掌握了用户隐私的公司似乎 还靠得住,但是掌握了大量用户数据的 公司远不止这几家。当掌握大量用户数 据的公司和用户利益发生冲突时,前者会有意无意地最大化自己的利益,而牺 牲掉用户的利益。
我们从前面的一些案 例中看到,把我们的隐私权建立在别人 的善意上,是根本靠不住的。
既然我们不能指望我们的隐私靠一 些公司的善意来保护,那么是否有希望 通过立法的手段来解决保护隐私的问 题,答案基本上是否定的。
首先在大陆法 系的国家,立法永远是远远滞后于 案件发生的。当科技和产业变化比较慢 时,这不是什么大问题。但是今天产 业发展太快,如果立法的速度真落后了 5 年,当法律被制定出来后,已经过时了。
更何况今天,大部分法律制定的时间远 不止5年。比如中国的电子商务在过去的 几年里迅速发展,与此同时卖假货的问 题也已经发展到不容忽视的地步,但是中国至今没有相应的集体诉讼赔偿法规和有效的执法手段。
因此,目前在 中国是无法靠法律手段杜绝假货横行的。
按照目前大数据的发展趋势,大家 会越来越没有隐私,而当我们体会到丧 失隐私后的重大损失时,为时已晚。
隐私 就像自由,只有当人们失去它的时候,才 知道它的可贵。
机器抢掉人的饭碗
技术对社会带来的影响有时候非常 诡异。
一方面它可以改善人们的生活,延 长人类的寿命,让一些处在新的行业、掌 握了新的技能的人发挥更大的作用;另 —方面则可能让更多的人无事可做。智 能革命也必然如此,当计算机变得足够 聪明之后,一定会取代人类完成很多需 要高智力的工作。
人类总体来讲是过分自信的,趋利 而忽视危害,这一点研究幸福学和心理 学的学者早就有了定论,我们不做过多 的讨论。
机器智能如此天翻地覆的革命, 不可能不对社会产生巨大的负面影响。 我们在给大家展示大数据和机器智能带 来的美好前景时,也必须强调它们可能 会给很多人的生活带来负面影响。
不过 遗憾的是,很多人对此不以为然,就如同历史上工业化国家的民众曾经的不以为 然一样。当社会面对重大技术革命所产 生的冲击不知所措,要两代人才能消除 它的负面影响时,大家才开始感叹历史 再一次重复。
智能革命将比过去历次技 术革命来得更深刻,对社会带来的冲击 可能是空前的。