学习笔记 |《统计思维》 笔记 | Day1


读书笔记 READING NOTES


《统计思维》西内启著,李晨译

第一章 当我们在讨论统计学时,我们在谈些什么


学会洞察因果的三步:

1.理解平均值和比例的本质含义(相同)

2.要从幅度而不是点来把握数据(区间的重要性)

3.明确以何种标准汇总何种数据(明确你要讨论的对象是什么)

寻找需要有限分析的解释变量:

1.过于显而易见的因果关系就别瞎分析了

2.这个解释变量现实中可控

3.容易被人忽视

平均值

平均值与比例本质相同,所以平均值的性质比例照用无误:对于无法用数值表示的定性变量,为每一分类赋值1或0,然后考虑“符合条件”的程度,计算这个定量变量的平均值就能得到比例。

区间比数值更重要:从最终想要控制的结果和可能的影响因素分析,数据分析有很强的结果导向,区分outcome和output,最重要的输出结果。要思考自己的数据能呈现出哪些需要最大化或最小化的目标。

最小二乘法厉害在哪里:(使得观测值和“真值”之间偏差总和最小的值,被认为是“可靠的推测值”,这就是中位数的理解,但是利用最小化绝对值推测真值的计算过于繁琐。)无论偏差的正负,偏差的平法都大于零,将使得平方和最小的值作为“真值”来推测。不计算绝对值而是计算平方这一小小思维的转变,却大大加速了统计学的步伐。

所以根据最小二乘法从存在偏差的数据中推测真值——平均值就是基于最小二乘法,考虑将观测值的偏差最小化时的优良推测值。

“虽然原始的分布不是正态分布,平均值却服从正态分布”的解释


留有所用的案例 Case demonstration

“社会学之父” L.A.(Lambert Adolphe Quételet,1796~1874)

【原书说是凯特莱,诶?不是孔德吗】

《论人类及其能力之发展:社会物理学》


记录闪现的灵感 INSPIRATIONS

理解分析方法本事或是了解众多特殊的方法,与思考在现实中如何活用这些方法、创造何种价值,本身就是不同的事。

商务活动以人的行为和社会状态的变化作为研究对象。这本书所涉及的,全都是为了洞察个人,并对其行动和状态进行部分改善的统计学。洞察人类行为的因果关系。

预测的困难,《信号与噪声》 | 纳特·西尔弗.

有许多统计学上的教科书上都写着,不要混淆相关关系和因果关系,但却很少提及,进行随机对照实验就可以判明因果关系。无论IT如何发达,现在最适合洞察因果关系的还是人脑。

数据分析的工作本来就是想找到有悖于经验和直觉的新发现,明明做着这样的工作却仅仅来验证自己的经验和直觉,这样真的很可惜。


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容