本文内容来自得到app上的《赤裸裸的统计学》解读版
随着大数据的越来越多的应用,呈现在我们面前越来越多的统计数据,由于每个人的生理和心理的特性,再加上某些人别有用心、故弄玄虚,导致会出现各种偏差。
- 不负责任的数据使用:挑选对自己有利的数据,通过统计的伪装来迷惑大家
- 误解事件之间的联系:漠视事件的相关性或者对事件的独立性视而不见
- 选择性偏见: 采样数据不具有代表性
- 发表性偏差: 媒体的选择性会影响信息的准确性
- 记忆性偏差: 记忆存在偏差,要对这种调查保持警惕
- 幸存者偏见:由于失败者都被淘汰,导致统计样本失真,比如基金经理的业绩
- 健康用户偏见:相关性并不代表因果关系。