大数据驱动的决策(以下简称大数据决策)的边界
大数据或者人工智能如此如火如荼,不可避免让很多人沮丧。就在上周,一个朋友还感叹着“一把辛酸泪,我们这些人迟早被机器取代”。
果真如此么?又或者如果是,那大数据决策或者是人工智能的边界又在哪里?几乎所有人类行动都可能被大数据、人工智能、机器人替代?如果不是,哪些是大数据和人工智能无法替代的?这个问题,我时不时也困惑着。记得在前年(2015年)参加两个小型论坛碰巧也是被大家热议,这两个论坛一个是经济主题,另一个是传媒主题,但都不可避免的谈到了大数据和人工智能。当然讨论的结果都是无果,有人悲观认为人迟早会被机器代替甚至被机器控制,有人则认为不可能。但不管哪种看法,都没有能有说服力的pros or cons.
去年读论文时看了一篇沃顿商学院两位教授和一位博士生的工作论文(目前这篇论文Under Review),顺便说一句,这两位教授都曾是MIT斯隆管理学院Erik Brynjolfsson(有兴趣的可以搜索一下此大牛)的学生,还都有MIT或Brown的计算机或者电子工程的学士和硕士学位,以及在IBM研究院工作经历。他们通过实证研究发现,在企业中,数据分析能力更多的在流程提升和组合已有技术式创新方面产生价值;而对于企业力图产生创造式或者说真正新颖的创新,数据分析能力则无甚效应甚至可能产生负向作用。(写到这里,我不得不“哈哈哈”一下)。作者进一步解释其发现,也就是说,企业拥有的大数据分析能力更多的有价值(强相关)于exploitative innovation(exploitation,利用式创新,国内多翻译为开发式创新;or simply,你可以理解为微创新、渐进式创新),而对于exploratory innovation(exploration,国内大多翻译为探索式创新,or simply,可以理解为时髦的范式创新、突破性创新、破坏式创新等)则并没什么价值。
而昨天看到HBR(哈佛商业评论)最新一期Roger L. Martin(2013年Thinkers50/全球50位管理思想家排行第三位)和Tony Golsby-Smith发表的文章则更为深刻和根本的讨论数据在商业决策或者说决策中的作用和边界。该文追溯了第一位提出科学的探索方法、强调科学的意义、并区别科学与哲学方法的亚里士多德。亚里士多德在定义科学方法的同时,也澄清了科学方法的边界,即使用在理解“不能不是这样”的自然现象上,比如为什么太阳每天会升起,再比如为什么会发生月食,等等。这些事物的一个共同特点是,它们超出了人类的控制,而科学就是去研究什么导致这些事物的发生。世界上的事,有超出了人类的控制范围,但也有大量的是由人的自由意志、权力、意识形态等等所控制和影响。也就是说,决策和结果有科学客观的因素,也有人的因素。即便亚里士多德他老人家,也相信世界的可能性最终并不是由科学分析,而是由人类发明(invention)和劝服(persuasion)所驱动,也就是这个意思。(注:我的理解,这里的invention可以认为就是上述的exploratory innovation;至于persuasion的理解涉及修辞学,这里暂不展开了。)
由此,大数据决策的边界也清晰了。决策(包括商业决策)中,该文认为,我们首先需要界定决策场景中哪些元素是人为可以改变的,是由人为各种可能在支配;而哪些元素是人为无法改变的,是必然性在支配。面对后者,我们可以充分使用大数据分析进行决策;而面对前者,我们则不宜依赖大数据,而应该充分发挥人类的创意和真正的创新。事实上,在后者这些决策元素上,大数据决策有着其局限性和无力感。
也就是如果如果决策逻辑是自然的、预期结果是天然设定的、有必然性在支配,这些就是大数据决策的边界。比如下围棋,就符合以上属性的决策,在这样的决策场景或问题,数据机器做的比人更有竞争力,随着大数据/人工智能的发展和采纳,这些决策过程中,人将会被越来越多淘汰。
当然如果问题决策涉及较大范围,其通常是同时拥有以上两种决策元素,也就是大数据决策(必然)和人类决策(各种可能性)的结合,最终的决策结果就是一个基于必然之上的各种可能性,即contingency。在这个意义上,下围棋其实是一个“简单”决策,Alpha go也只是在这个“简单决策”上胜出。尽管它看上去需要较高的智力水平。而一个家庭决定周末要不要去露营,还是宅家,却是一个极其复杂的决策,因为其涉及家庭人员权力、情感、道德、话语技巧和当时的心理状态等等各种因素而最终可以被人所控制。其结果是无法利用大数据决策进行预测的。
另一方面,大数据决策在很多方面反而会产生误导。两位作者以乐高为例,乐高经过历史数据发现,发现玩建筑类玩具的85%都是男孩子,即使公司花大量努力去改进改品类玩具的设计吸引女孩子,都以失败告终。这时候公司大部分管理层认为,女孩子天性不喜欢玩建筑类玩具,即这是一个人“不可控”的事物,但是CEO Knudstorp却认为问题是乐高没有找到如果让女孩子玩建筑类玩具的途径。这后来,乐高的“朋友”玩具产品线由此产生并在女孩子喜爱的爆品。因为大数据的来源是产生于历史,如果是在历史的相似或者路径上,依据大数据决策可以挖掘出相应的决策信息,但也会隐藏或蒙蔽了历史数据中未能揭示的历史。因此,也可以理解为什么大数据能力在突破性创新(exploratory innovation)的弱效应乃至负效应。
总而言之,大数据决策或者人工智能有其边界,有其局限性。人类决策有其价值,有其需求。正在影响世界的最终还是人类决策。此外,基于计算理性的人工智能决策只占了人类社会世界生活的一小部分而已。
那在这里,套用一句话,让上帝的归上帝,让凯撒的归凯撒。我们充分认识到这些边界,了解人之所长和所短。理解决策中人之因素和人之价值。这样也能更好的让我们参与到管理决策中去。