最近群里、订阅号陆续出现一篇文章,有个招眼球的题目,《最新离婚大数据曝光:所有的离开,都是蓄谋已久》,从题目上看,确实作者花费心思不少,冠以大数据的名义,加上一个“文艺”范儿的说明,直扎一些整天担心婚姻状态的女生内心,自然博得众多转载。仔细阅读后,却不是滋味。
啥都敢叫“大数据”
提起“大数据”一词,近几年也是被“炒”的够火。如今连做个简单的统计摇身一变,戴上这顶“高帽”。要是再配个office表格数据图形,让人看起来“高端大气有品味”。“大数据”词汇一出现,浑身便会散发出强大的气场,各类文章出现,宣传是“大数据时代”,啥都要和“大数据”沾边,紧跟时代潮流。开句玩笑的话,部分作者不懂大数据,文章非要加上“大数据”,浑身便散发出“科学”的各种场信息,给人以满满的正能量。读者哪敢有半点疑惑,焦虑的买个“大数据时代”之类的书籍、音频课程都来不及,甚至后悔没有从小培养“数据场”,生怕暴露自己在这方面的不足,被打上被“时代”抛弃的标签。
数据也是会骗人的
提起数据,该大家的印象多数是真实、准确等正向词汇,即便想到作假、骗人,人们想到的也是数字作假,人为动了手脚,数据只是某种现象的反映,即使是真实反映情况,也只能在有限的条件下冠以真实,数据常常被弄成一个任人打扮的“小姑娘”。下面来详细分析那篇文章。
不敢苟同的数据分析
作者在文中用三组数据阐述:
-
离婚的人越来越多
-
谁想离婚?
-
为什么离婚?
于是作者非常肯定的语气说出:“我现在给出证据。 来看3组官方公布的大数据”,看起来令人信服吧。一堆华丽的数据,还很采用可视化的方式展示。看似有理有据,却存在很多问题。
离婚的人越来越多
作为一个成人,基本都有20年以上的经历,对于“离婚人数变多”这件事,大家不看数据也是知道的,我想大家根本不需要数据证明一个“常识”。
当然,说到数据,有个“隐含”的情况也在影响这个数据,就是出生率的减少及人口的老龄化,适龄结婚的人口减少,
观点2可能犯“幸存者偏差”错误
二次世界大战时,美英联军对德国展开了战略大轰炸。由于德国防空力量强大,美英空军损失惨重,国防部找来飞机专家,要求研究战斗机受损情况,对飞机进行改进。专家们检查了执行任务归来的飞机,发现所有飞机的机腹都伤痕累累,于是专家们建议,机腹非常容易受到防空炮火攻击,应该加强机腹的防护。最后国防部的改进要求却是,改进和加强对机翼的防护。因为国防部的一个统计学家发现,能够幸运返航的飞机,机翼都完好无损,这说明,被击中机翼的飞机都坠落了,而仅仅被击中机腹的飞机都返航了,应该加强防护的是机翼,而不是机腹。统计学里将这类因结果导致错误认知的情况,称为“幸存者偏差”。
这是一个经典的“段子”,虽然出处、描述存在明显的问题,如航空专家需要看统计数据才知道飞机哪部分重要,想必“砖家”无疑。却通俗的解释了数据在使用数据时存在“偏差”。有着“幸存者偏差”类似的错误。可是作为作者口口声声说的“证据”,
真理哪怕往前多走一步就是谬论
观点2谁想离婚,应该采用民政部门的数据,而不是一些闹到“法院”的离婚案件数据。依据数据只能读出:
- 离婚案件中多数是女性起诉
- 女性常因“生活琐事”、“分居”原因选择离婚起诉
- 约9成是因为一方不愿意离婚才起诉(“离婚程序要求”)
- 其他同意离婚,可能是财产分配、子女分配等导致起诉
论点3误将“相关”看作“因果”
第三个图给的数据说明确实比较客观:“2018年,全省所有离婚案件中,排在第一位的离婚原因,不是出轨不是家暴不是穷,而是「生活琐事」”,从表面上看,是生活琐事占据很大比例,看似支持结论,真的能得出“女人,在恼人的「琐事」里耗尽热情”的结论?
仔细观察结论,排名前三的理由:生活琐事、分居、感情基础脆弱,可以大而化之为双方脆弱的感情纽带已经断裂,不再容忍对方的缺点,甚至无法“共处一室”,在同一屋檐下也困难。但很难说是生活琐事导致的,可能感情基础薄弱及生活琐事高度相关,是否为因果关系,需要严格论证,从习惯来看,好像互为因果,简单粗暴得出男的不顾生活细节(这事浙江,南方男生相对北方在家务等要比北方好太多,如果是这样,是否因为在家不够暴力[大误])导致女人离婚,纯属无稽之谈。
反思
根据上述的分析,原文作者依据全国数据论证观点1、2,加上浙江一省的数据说明观点3,最后推导出全国“男人往往乐在其中,女人却常感不满。而越来越多女人,在恼人的「琐事」里耗尽热情,决定不再忍。”,整个过程完全建立在错误分析之上,感觉就是作者先确立结论,再找数据拼凑论证,为了证明“科学”,冠以“大数据”之名。科学的结论必先基于数据统计分析,抱着审慎态度一步步艰难探索。
最后,从数据上看到几点现象,大家可以根据“幸存者偏差”等尝试解释:
- 为啥起诉的多是女性?
- 为啥浙江因出轨起诉比例较小?