《上游》5:支点和预警
“上游思维”的两个思路是找到支点和提前预警。这两个思路都要求你对系统有深刻了解,需要实时的详细数据,而且常常需要对系统做特别的布置。你可以说上游思维需要硬条件,但也可以说,恰恰是因为人们有了上游思维,才会去设法创造那些硬条件。
两个上游思维的解题思路,一个是“寻找支点”,一个是“提前预警”。
1.一个支点
2008年的芝加哥治安很乱,经常爆发枪战,有些青年人被杀死。很多人以为这都是黑社会火拼,就好像电影《教父》那样。但是芝加哥大学研究犯罪的学者,有个不一样的洞见。
数据分析显示,绝大多数枪案并不是有预谋的。通常的剧情是这样 —— 两拨年轻人在街头对峙,其中一方怀疑另一方的某个人偷了他们的自行车,另一方说没偷。双方争辩过程中,那个被指责的人扭头就走。这边有个小弟认为这种行为是对本方人员的侮辱,于是掏枪开火!那边一看也赶紧拔枪,砰砰砰之后,有人倒在了地上。
犯罪学家对此总结了一个公式,说暴力犯罪是由四个因素导致的:年轻 + 冲动 + 酒精 + 枪 = 尸体。
那政府能影响哪个因素呢?年轻是自然现象,禁酒禁枪都是老大难问题,有人提出,也许可以从“冲动”入手,看看能不能帮助年轻人遏制一下他们的怒气。
当时有个社会人士自己搞了个项目叫“成为男人”(Becoming a Man),相当于是一个心理咨询课程,告诉年轻人,真正的男人不是一言不合就拔枪那种,而是负责任、能忍耐的人。芝加哥市政府给了这个项目一笔经费,允许他们雇佣十几个老师,到芝加哥市 18 个高中开课 —— 条件是必须接受随机实验研究,看看你这个项目到底有没有效果。
结果一年下来,和对照组相比,参加“成为男人”课程的学生,被捕率减少了28%,暴力犯罪率减少了45%,项目非常成功。
所以美国人为了降低犯罪是啥招都用。希思说,这个思路的关键是找到了“支点” —— 阿基米德不说吗?“给我一个支点,我可以撬起地球。”支点就如同系统的穴位,在这里用力能事半而功倍。
*
支点也可以是人。犯罪学家用数据分析发现,芝加哥最危险的,其实只有5000个人。他们只占总人口的0.2%,但是跟17%的杀人案有关。
那么与其被动地等着犯罪发生,为什么不先把这五千人按住呢?有人算了一笔经济账。每处理一起涉及到开枪的暴力案件,全社会花掉150万美元 —— 而给这五千人每人提供两万多美元的生活补助,让他们有个工作干,有个地方管着,总体来说其实更省钱……
支点往往是系统中最危险的因素。而如果你仔细考察,你会发现各种因素的分布非常不均匀。
再比如说,急诊室是非常稀缺的资源,花费很高 —— 但是每个人去急诊室的概率并不是均等的。普通人很多年也去不了一次急诊室,而有些老病号恨不得一年去一百次。那为了节约医疗资源,我们应该从上游就把这些老病号安抚好。派一些普通的医护人员定期去这些人家里访问一下,看看有没有什么能帮忙的,也许他们就用不着动不动就去急诊室麻烦那些主力医生了。
但是如何找到系统中关键的因素呢?现在都是用数据分析。
2.找到那些人
2010年,领英(LinkedIn)推出一项面向公司的付费订阅服务,帮助公司在领英招纳人才。这项服务的口碑很好,有很多公司喜欢用……但领英感到不满意的是,它的退订率高达30%。有的公司订了一段时间就退订了。
其实每个订阅服务都有这样的烦恼。那怎么降低退订率呢?当然是数据分析。数据分析能告诉你要退订的用户有什么行为特征。
领英原本的做法,是看看那些用户似乎快要退订了,就赶紧给他们打个电话什么的,联络联络感情。你有什么需求吗?有什么困难吗?我们做什么能把你留下呢?
但是后来有人发现,用户会不会退订,其实不是他最后一刻才做出的决定 —— 他早就该退了,他只是后来才意识到自己该退。数据分析显示,用户开通订阅服务后,如果头30天没怎么使用这个服务,那么他将来退订的概率比一般用户要高出4倍。
没人会长期花钱订一个自己不用的服务。而领英这个发现是用户第一个月的活跃度,对你来说是个预警信号!
所以领英赶紧把关注点放在了新用户上。如果一个用户订阅后第一个月不活跃,领英会给他提供特别主动的帮助:手把手教怎么建立账号,帮着设计第一个招聘广告,对如何处理应聘邮件提供建议,等于说恨不得替用户把活儿干了……这个措施让退订率降低了一半。
*
大动作都是事先有迹象的,这些迹象给你提供了预警。
校园枪击案是美国的一大顽疾。有一个枪击案受害学校的一位联合创始人,叫妮可·霍克利(Nicole Hockley),她自己的亲人也是受害者,她再也看不下去了。
霍克利说,学校就只能被动等待吗?为什么不能提前干预?
枪击案的凶犯其实是有迹可循的。他通常就是这所学校的学生。他会在动手之前六个月就开始准备。每10个凶犯中有8个,会至少向身边的一个人提起自己的计划,有的甚至还会在社交媒体上贴出明显的威胁。霍克利说,我们为什么不能根据这些迹象,提前锁定可能的凶犯呢?
霍克利搞了个训练项目,让学生留心同学中有没有这样的人 ——
*这个人特别喜欢枪支;
*容易为一点小事就发火,并且有攻击行为;
*平时独来独往,有强烈的被孤立的感觉;
*曾经吹嘘他有枪或者能拿到枪;
*尤其是他可能明确发出威胁
霍克利甚至还组织拍摄了一个短片,叫 Evan,发布在 YouTube上。这个2分28秒的短片,看一遍就不会忘记。故事说一个高中男生和一个女生通过文字联系,慢慢产生感情,两人终于在图书馆见面,才知道对方是谁,非常浪漫的情节……但是紧接着,一个学生举起了自动步枪。情节倒叙,你才发现原来前面剧情的每一步的背景之中,那个枪手都有出现:他曾经在食堂独自用餐,曾经在走廊被人霸凌,曾经向同学做出了开枪的手势,但是没有人注意到他。
这个短片引起了极大的争议,很多人认为这是对同学的歧视,但是这个片火了。霍克利要传达的信息传达出来了,宾夕法尼亚州建立了一个电话系统,接受学生的匿名举报。
在 2019 年这一年之中,因为这个举报系统,有关方面成功干预了 46 起自杀,制止了多起校园霸凌,并且很可能真的破坏了一次校园枪击预谋。
当然上游思维的麻烦在于你很难证明这个干预行为是对的……警方在一个高中生家里找到了一把装满子弹、不受大人限制的手枪,但是你永远都不能说那个学生真的打算杀人。
上游思维会给你带来很多假的警报,必须非常小心才行。
3.假警报
2000年以后连续十几年,韩国被诊断出甲状腺癌的人越来越多,最后居然达到了1993年的15倍。癌症又不传染,这是怎么回事呢?而这些甲状腺癌几乎都被治愈了,五年存活率高达99.7%,是世界最高水平。韩国人还专门吹嘘自己的医疗水平,号召外国人都来韩国治疗甲状腺癌。
但这其实是一个假警报的故事。以前人们以为只要有癌细胞就是癌症,就应该立即治疗,现在认识转变了。癌细胞按照分裂速度分,有三种。特别慢的分裂,不治疗也不会有什么危险;特别快的分裂,想治疗也治不了。医学应该治疗的,其实是那种分裂速度*比较快*的癌细胞。
而韩国 2000 年以后诊断出来的甲状腺癌,大多数都是分裂慢的这一种 —— 其实根本就不用做手术,做了手术当然也都能存活,这就是为什么“成功率”有那么高。
上游思维是没事儿找事儿的思维,你总会面临假警报的问题。如果是校园枪击案,就算敏感度高一点似乎也是应该的,那如果是癌症呢?如果当时人们并不知道分裂慢的癌细胞不危险呢?这里没有统一的标准,你只能自己拿捏。
但不管怎么说,有个预警机制总是好的。
*
纽约市有好几个医院系统互相竞争,其中一个重要指标是接到患者电话之后,救护车多长时间能到。有个医院系统把这件事做到了极致。
一般的医院都是把救护车停在一个固定的地方待命,很多都放在消防局。而这家医院,则把救护车提前在全市各个地点做好了布局。
医院通过数据分析,知道什么时间、什么地点容易有人叫救护车。比如养老院每天晚上开饭这个点,就是叫救护车的高发点 —— 为什么呢?因为工作人员会在这个时间去每一个老人的房间叫老人吃饭,最容易发现状况。
而这家医院会提前把一辆救护车停在养老院附近,比如说麦当劳的停车场。这样一接到电话马上就能到。而且它的救护车布局还会动态反应:一辆车接了病人离开了,别的车就要调整位置,给它补位。
使用这个方法,这家医院把从接到电话到救护车抵达的平均时间,做到了 6 分 30 秒 —— 而纽约市其他医院的反应时间是 8 分钟。快出来的这1分30秒,对心脏病患者来说也许就意味着生死的区别。
*
现在预警系统已经到处都是了。2011年日本大地震,地震波监测给仙台市提供了30 秒、给东京提供了90 秒的预警。这个时间足够让火车停驶,让工厂停工,让学生钻到桌子底下,这是可以救命的预警。
现在很多电梯厂家会给电梯的各个部件装上传感器,传感器会把数据发到云端。IBM的Watson(华生)人工智能系统会分析这些数据……然后你就能在电梯还没坏、但是快要坏了的时候去把它修好。
原理是这样的。比如说电梯门,平时都是5秒钟打开。从某一天开始,5.1秒才打开,没过多久又变成了5.2秒才能打开。任何人都感知不到这种细微的差异,但是传感器记录了,Watson 感觉到了。Watson 会预判这个电梯门过几天就会坏了,那么电梯公司提前派人维修,就根本不会出现把人锁在电梯里出不来那种事故。
等到 5G 和物联网全面铺开,这个世界会有多少这样的预警系统。
*
找到支点和提前预警。这两个思路都要求你对系统有深刻了解,需要实时的详细数据,而且常常需要对系统做特别的布置。你可以说上游思维需要硬条件,但也可以说,恰恰是因为人们有了上游思维,才会去设法创造那些硬条件。
《上游》6:官僚系统的悖论
上游思维要求你设定考核指标的时候,至少要考虑三种“假成功” ——
第一,如何去除运气的成分?
第二,这个指标和我们的使命是完全一致的吗?
第三,人们有没有可能会为了达到指标而伤害使命?
系统之外的力量,可以约束系统。
希思提出了七个上游思维的解题思路,这一讲说第五个,如何发现“假成功”。
“假成功”的含义是双重的。一方面,上游思维是没事找事的思维,你需要去发现那些看似成功、实则不成功的局面,找出问题。另一方面,上游思维也是长远考虑,你在设计一个制度的时候,得考虑到这个制度可能会带来假成功。
所有这些都涉及到了官僚体制的一个本质矛盾。
这一讲说的政府都是美国政府。美国制度和中国大不相同,但是全世界的官僚体制有同样的问题。
政府要办事,就得雇佣一个庞大的官僚集团。要确保官僚集团认真办事不偷懒,就得对他们进行考核。考核就得设定各种指标。有了指标,官僚集团迟早就会为了完成这些指标而做事 —— 以至于忘了自己最初的使命是什么。
而指标意义上的成功,很可能是假成功。这是一个悖论。
希思把假成功分成了三种情况。
1.涨潮式成功
中国有一句话叫“站在风口上,猪都能飞起来”,巴菲特也说过一句话叫“只有退潮了,才知道谁在裸泳”。这个道理是有时候只要跟对了“大势”,你不需要有本事就能成功。
牛市的时候人人赚钱,每个基金的报表都好看,每个人都认为自己善于炒股,殊不知只是运气好而已。亚洲某国在一段时间里经济增长速度特别快,大家都说这是因为总统的政策好 —— 可是你对比临近国家,印度尼西亚、马来西亚那时候的增速也达到10%。
而论功行赏的时候,官僚集团可不会跟你讲当时的大势。
希思说的案例是上世纪90年代,美国所有地区的犯罪率都下降了。到底是什么原因导致的下降,我们专栏也讨论过,到现在也没人能说清楚,你只要知道是全国都下降就行。
而当时美国各地警察局的领导,可是都把犯罪率下降的功劳记在了自己头上。那些在 90 年代当过警长的人,都纷纷开起了自己的“犯罪咨询公司”,用犯罪专家的名号赚了不少钱。
他们对外鼓吹、并且也真诚地相信,在自己的治下,辖区内的犯罪率大大下降了 —— 他们说的没错,但他们不会告诉你的是别人辖区内的犯罪率也下降了。你换成上世纪八十年代,没有一个警长敢开咨询公司。
这种事情比比皆是。孩子学习好是老师和学校的功劳吗?好学区的家长本身就很厉害,这些人的孩子放在哪里学习成绩都会很好。传染病人在服用了某种汤剂之后纷纷阳转阴,是这个汤剂的功劳吗?别忘了绝大多数人就算不吃药也会自愈。
你要不做随机实验,就很难知道哪个官员、哪个政策到底有没有用,可是社会治理恰恰很难做随机实验。
2.指标式成功
一个美国波士顿市城市建设的案例,听听这里面有没有毛病。
波士顿市有个“城建办”之类的机构,它的责任之一是每年维修全市的人行道。为了考核这个工作,市政府设定了三项指标。
第一是经费,政府把全市分成三个大区,每年总共给4.5亿美元的维修经费,要求投在每个大区的钱要大致相同,体现平等。第二是考察每年总计修路的面积,体现效率。第三是波士顿有个群众来电系统,任何人发现市区哪里不对就可以拨打“311”电话让政府处理,市政府会考察城建办解决了百分之几的群众来电,体现为人民服务。
城建办的三项指标成绩都很出色。那你说还能有什么不对。
2014年,城建办新来了一位总工程师,叫凯蒂·崔(Katie Choe)。崔总工要求彻查全市所有人行道状况,然后她发现一个大问题。
原来城建办每年修路都修到了富人区。穷人区的人行道状况非常差,可是从来不修。难道说城建办歧视穷人吗?
还真不是。城建办是根据分区和311电话决定去哪修路,三个大区都有穷人,可是穷人不打电话。穷人习惯了。穷人感觉自己一向都是被政府忽略的,打电话也没用,所以干脆就不打了 —— 这是一个自证预言!你以为自己被忽略,结果你就真的被忽略了。
年轻气盛的崔总工认为这太不公平了,她决定把修路计划对穷人区倾斜,结果城建办把 80%的经费都拨给了穷人区。
崔总工做得对吗?对官僚系统来说,真不一定。
市长就不太赞成这个做法。如果富人打了电话,路却没有修,他们会动用政治力量给市长施压。再说就算你给穷人谋福利,那如何证明这是个福利呢?你能统计出修路给穷人的生活带来了多大的改善吗?穷人是上班更方便、还是上学更方便了?有什么量化的指标能证明吗?
3.指标的逻辑
丹尼尔·卡尼曼在《思考,快与慢》这本书中讲过一个心理效应。当我们面对一个困难的问题、感到太复杂了不好回答的时候,会本能地找一个简单问题去替代它。你回答了那个简单问题,就以为自己已经回答了那个复杂问题。
比如有一位富豪说自己刚刚重金买入了福特公司的股票,卡尼曼问他为啥投资福特呢?富豪说,我昨天在车展上看见福特的车,我特别喜欢。
这是一个逻辑错误。福特公司值不值得投资,你得跟别的公司比较才行。车再好也得看看成本、价格和市场定位吧?投资决策是个复杂问题,富豪想不明白复杂问题,就用一个简单问题来替代 —— 我喜欢福特的车吗?喜欢就值得投资。殊不知喜欢福特的车跟投资福特是两回事。
这个心理效应现在叫“直觉启发式(Intuitive Heuristics)”。希思说,官僚系统用指标考核,犯的是同样的错误。
工作做的好不好,这是复杂问题;指标达没达到,这是简单问题。
*
再举个例子。有个商家做电子邮件广告,本来你关心的是广告对产品销量的刺激效果,但这是个复杂问题。人们看了邮件不一定马上买,买的也不一定是因为看了邮件,你没法精确测量邮件的效果。
于是商家想到一个简单问题,那就是看邮件的打开率。我们收到很多邮件连标题都没点开就直接删了,那如果这个邮件的打开率高,不就是挺成功的吗?
结果这项指标一经实施,邮件打开率的确是显著提高了 —— 但是产品的销量却显著下降了。为什么呢?为了提高打开率,编写邮件的人会使用耸人听闻的标题。标题给读者的预期跟产品的实质很不一样,读者一失望,反而不愿意买了。
考核指标会让官僚集团忘记自己的初心和使命,可是你要没有指标,他们简直就不知道该干啥。
芝加哥高中教育改革,学校系统可不是说你说这么改就这么改,他们要求用指标看成效。这个指标不能等学生高中四年毕业再看,甚至连一年都不能等,官员要求立即看到成效 —— 结果他们看的指标是高一新生的出勤率。改革开始之后出勤率果然上升了,官员才相信改革的方向是对的。
一切都要有考核指标,但指标会带来问题。
接着说第三种假成功。
4.指向失败的成功
上世纪 90 年代美国各地的犯罪率都在下降,这个下降是真的,但是里面也有水份。
从1994年开始,美国各地警察局都用了一个叫 CompStat 的软件,目的是用大数据帮助执法。警察要把每一个案件的时间和地点都录入到软件中去,然后据此在犯罪高发地段投入更多的警力。比如一个地方晚上抢劫案特别多,那警察就要多到这里来巡逻。这都没啥问题。
配合 CompStat 软件改革的还有一个政策,各地犯罪率,和警长 —— 大约相当于中国的公安分局局长吧 —— 个人的考核是联系在一起的。如果你任职期间犯罪率下降,你就会升职加薪。而恰恰是这一点,造成了严重的问题。
2018年,一个纽约的老警察上 Podcast 节目爆了一个猛料。他说警长们会使用各种办法,人为地减小自己辖区的犯罪率。一个常见做法,是把案件给“降级(downgrade)”。
比如有个真实的例子是这样的。一个巡逻警察听到呼救,当场破获了一起强暴女性的案件。犯罪分子被抓了个现行,人证物证俱在,唯一有点特殊的是,受害者本身是个妓女。当然妓女也受法律保护,这不是一次性交易,犯罪分子没给钱,而且明确违背了受害者的意愿。现在事实俱在,该怎么办就怎么办呗?
不行。巡警把案情报告给警长,警长并没有接受警察和受害女性的说法。他反复询问这位女性案发的各种细节。老警察一看就明白警长想干什么 —— 他是要把犯罪降级。
警长从受害女性供词中挑了几个“漏洞”,把案件从强暴给改成了……“服务偷盗”,也就是接受了别人的服务没给钱的意思。重罪一下子变成了轻罪,本辖区犯罪率就不会受影响,警长的考核指标就不会变难看。
那你说难道没有人监督这些警长吗?至少官僚系统不会。警长把自己辖区的低犯罪率汇报给纽约市警察局的局长,局长也很高兴,等于是他治下的犯罪率下降了。局长把这个成绩汇报给市长。
那你说市长是民选的,他得为民做主吧?事实是市长也乐于看到犯罪率下降。犯罪率下降,纽约市的房价才能上来。房价上涨,市长政绩才能体现出来。
这还不算完。等这一任警长退休走人了,新任警长来了会怎么办呢?难道他会说我们从此采用绝对诚实的统计方法吗?那样他治下的犯罪率就直线上升!他只能继续美化数据,让犯罪率必须进一步降低……
*
希思把这一切的做法,叫做 gaming —— 你用指标考核我,我就用各种办法让这个指标好看,就好像体育比赛一样。Gaming 不是公然的造假,谁也没有拿个报表胡乱填写数字:每一个数字都是切实统计出来的,每一个案件都有据可查,只不过可能执行的统计标准跟你想的不太一样而已。
长此以往,数据可能会变得比较离谱。也许有个公民记者跳出来说纽约市的犯罪率数字根本不可信!警局在欺骗市民!……其实这么说也不准确。
“汉隆剃刀”,能用愚蠢解释的就不用解释成恶意 —— 同样道理,能用官僚系统自身的悖论解释的,就不用解释成某一个官员的故意腐败。这个悖论是不用量化指标考核不行,用了量化指标就会有 gaming。就算每个官员都是诚心诚意的人民公仆、没人想祸害百姓,整个官僚系统也会把事情给扭曲掉。
而这种千方百计美化指标的成功,最终会让系统走向失败。
*
总结来说,上游思维要求你设定考核指标的时候,至少要考虑三种“假成功” ——
第一,如何去除运气的成分?
第二,这个指标和我们的使命是完全一致的吗?
第三,人们有没有可能会为了达到指标而伤害使命?
其实官僚系统的悖论并不是完全无解的。你要做的是把定量指标和定性的考核结合起来。英特尔公司的前任 CEO 安迪·格鲁夫(Andy Grove),就搞过一个“双轨制”:一方面看数据指标,另一方面是让管理人员亲自下去考察。
工作做得好不好,人工智能看不出来,人的智能还是能看出来的。就算没有指标,就算没人打电话,你也能明白,穷人区的路是真该修了。
制度再完善也不可能是万能的,对官僚集团必须保留一定的“人治”。大领导总得亲自看看情况,老百姓可以不满意,记者可以批评,社会活动家可以组织抗议,退休公务员可以上节目讲讲里面的猫腻。系统之外的力量,可以约束系统。
再好的制度也会被官僚集团玩坏,但是人的眼光不会一直被蒙蔽。