自从大数据开始流行,“以数据说话”的要求变成了写P和汇报的日常。在图书馆偶然翻到一本书,简单统计学,用各个幽默精辟而又逻辑缜密的小例子,教你如何开穿统计结论里的小九九,有利于以后网上能稍微避开带节奏的所谓数据分析大师挖的坑。
1、如果下意识的觉得一个论断过于荒诞,或者某个论断具有较大的争议性,异于常理,在没有绝对数据证据支撑之前,要保持着怀疑态度,它需要经的起检验。就好比经不起重复实验的论文,即使是大佬也可能是在造假。即使当下看起来确实为真,也不要着急着下结论,有可能类似于在gradient descent里,你以为找到了最优,其实只是一个局部解。
2、“眼见为实”的观念有时会让我们陷入幸存者偏差的误区,根据眼前的显性现象拍出结论。但有时看不到的数据或者轻易被遗漏的数据同样蕴藏着重要的信息,有可能对结论造成决策上的影响,需要回溯过去、立足现在、展望未来,多维度关联分析。有时分析大师会故意丢弃、隐藏或者微调某些信息,误导人们去相信他们发表的“数据事实”。
3、A/B test,经典有效。
4、经常踩的坑,自己有时会根据经验在潜意识里先做出了基本的预判,自选择偏差往往会让自己放松警惕,更倾向于轻易认同与自己观念相符的数据结论。
最后,“彩票是种智商税”,很想知道原文是什么,感觉说的很有道理,这句翻的很入我心。