3月份言值读书会-好书共读-《学会提问》day22
【原文】
最近的一个新闻标题:40%的大学生饱受抑郁症的折磨!
在你情绪低落的时候你该不该过分担心呢?你又怎么知道自己可以相信这样的统计数字? 任何统计数字都要求发生在某地的某些事件能被界定并准确识别出来,这常常是一项非常艰巨的任务。
因此,要找出欺骗性的数据,第一个策略就是尽量找到足够多的关于这些数据是如何采集的信息。我们能不能准确地知道美国到底有多少人在报税单上做过手脚,多少人有过婚前性行为,多少人开车打手机,或多少人使用违禁药品?
如果你想象一下做这些统计的细枝末节,那么我们怀疑你的答案肯定会是“不太可能”。为什么?因为要为特定的目的得到精确的数据,你常常会遇到各种各样的拦路虎和绊脚石,其中包括关键词语的模棱两可,识别相关人员或事件的种种困难,人们不愿意提供真实的信息,不能报告各种事件,还有观察事件时存在的种种身体上的障碍等。
因此,统计数据的形式往往只能是基于事实做出的一些估计。这些估计有时候很有用,但它们也可能有欺骗性。记住总要问一问,“作者是怎样得出这个估计的?”得到的细节越多越好。
【感受与思考】
近几年,大数据分析非常火热,各式各样的用户消费报告,行业报告层出不穷。随便在网上一搜,就能找到很多,而数量的多,也同样意味着鱼龙混杂,普通人若要去看这些内容,就得仔细分析,避免偏听偏信。
下图来自于Mob大数据(18年年底的报告),我们可以清晰地看到苹果手机与华为手机,其用户画像的对比。
说苹果手机用户是“隐形贫困人口”,我当时看到的第一眼就感到愤愤不平,怎么可能?太反直觉了!
而对于这个话题,我自己是利益相关者,因为我就是一个长期使用苹果手机的人,所以很有动力,去分析报告上的数字障眼法。
这个报告的主要问题有两点:
①把使用某款手机,过度地当做了身份标签
按照报告的逻辑,使用苹果手机=穷人,但是要知道,在中国,马云可是苹果手机的头号粉丝,逻辑错误,自然也会出现啼笑皆非的谬误。数据本身也许不会骗人,但是数据的收集方式+解释方式,会给人带来很大的误导。
②没有展现某款具体手机的用户人群分布
如果年轻人(18到34岁),占据总体苹果用户数量的30%,这可并不意味着,苹果手机就是年轻人的专属,那么,自然也就不能得出,低收入人群才使用苹果手机这一结论了。
当然,最后还是得补充一下,报告终究只是一种参考,就像买东西要货比三家一样,我们不能只固定看一家数据机构的分析,而是应该多方比较,争取做到理性客观。多数数据机构,毕竟是商业性质的,他们往往会和某些品牌方,厂家,形成一定的利益互换关系,掺杂了金钱和偏见,数据报告也就成了一种“营销手段”了。