作者和本书概要
查尔斯•惠伦(Charles Wheelan),于1997~2002年间担任《经济学人》杂志驻美国中西部地区的记者,还为《芝加哥部报》、《纽约时报》和《华尔街日报》撰稿,所著《赤裸裸的经济学》是畅销多年的经济学普及读物。
《赤裸裸的统计学》是一本关于统计学常识的科普书。
内容
作为大数据时代炙手可热的学问,统计学可以解决很多实际问题。可如果运用不当,统计学也会制造假象、造成误导。
了解统计学,了解在大数据时代生存的游戏法则。 运用好统计学知识,能让我们在面对陌生问题的时候,得出有说服力的结论,做出合理的决策。
统计学家的工作:通过分析数据来推断事物的本质,预测它未来的发展。
一、大数定律
大数定律 的数学表达:当试验次数足够多时,实验结果的平均值会无限地接近一个数值,这个数值一般叫做“期望值”。
彩票:发行机构只要保证彩票的销售额大于奖金期望值,就肯定赚钱。
赌场:只要能吸引到足够数量的赌客,不管幸运儿赢走多少钱,赌场永远是最后的赢家。
投资
风险承受能力越强,意味着允许试验的次数越多,也就越有可能赚到期望的投资回报。保险行业
二、中心极限定理
中心极限定理: 任意一个群体样本的平均值,都会围绕在这个群体的整体平均值周围。 任意群体样本的平均值≈整体平均值
例子🌰: 假如你烧了一锅汤,想知道味道怎么样,没必要把汤都喝光,只要尝一小勺就可以了,任意一勺汤的味道绝不会相差很远。
三、随机抽样
选取代表性样本的过程就是随机抽样。 注意偏见。
选择性偏见
幸存者偏见
健康用户偏见
四、回归分析
回归分析 :通过一个已知的现象,来找到未知的原因。多元线性回归方程模型。研究复杂统计学问题的必备工具。保持理性的态度。
五、常犯的错误
- “黑天鹅事件”:一般用来指那些影响很大,但难以预测的小概率事件。
美国次贷危机,致命问题是它的概率学模型参照的是过去20年的市场行为,不能对未知的意外情况做出预测。
- 统计误差: 只要数据分析建立在抽样调查之上,样本的统计结果和真实情况之间就会存在误差。
六、总结
精确有时候并不意味着准确。
概率学本身不会犯错,犯错的是使用它的人。
随着大数据时代的到来,转变自己对周围世界的认知方式非常重要。
参考:得到-每天听本书