统计学七支柱
史蒂芬·斯蒂格勒
13个想法
前言
>> 我不打算告诉你统计学是什么或不是什么,而是尝试制定七个原则,即支撑统计学领域的七根支柱。
>> 第一根支柱称为聚合(Aggregation)。我们也可以使用它在19世纪的名称“观测的组合”,甚至使用最简化的名称:均值。
>> 第二根支柱叫作信息(Information),更具体地说是“信息度量”
>> 我将第三根支柱命名为似然(Likelihood),意味着使用了概率的推理的校准。显著性检验和普通的P值都是最简单的似然形式
>> 第四根支柱的名字是相互比较(Intercomparison)。
>> 第五根支柱叫作回归(Regression)。
>> 回归现象可简单解释为:假设有两个不完全相关的观测变量,你选择了其中极值远离均值的变量,那么可以预期另一个(以标准差为单位)不会那么极端。
>> 第六根支柱是设计(Design)。类似于在“实验设计”中的含义,但“设计”的范围更广泛,它的目标是:先设定观测的权重相同,再训练我们的思想。
>> 第七根也是最后一根支柱称为残差(Residual)。“残差”表示“其他的一切”
第1章 聚合:从表格和均值到最小二乘
>> 思维是忘却差异,是归纳,是抽象化。而富内斯的拥塞世界中仅仅充斥着触手可及的细节。
第3章 似然:概率尺度上的校准
>> 测量只有用于比较才是有用的。背景提供了比较的基础,或是一条基线、一个基准,或是一组用于相互比较的测量。
结论
>> 第一根支柱——“聚合”,本质上在讲信息的放弃,这是一种“创造性毁灭”的行为。
点评
认为一般
从七个角度介绍了统计学的发展史