数理统计随笔01-什么是不相关

> 其实很多数理统计的概念都是非常直观的,这与数理统计本身是一门与现实生活密切相关的学科有关。很多数理统计上的公式仅是人们日常思维模式的形式化表达。可惜很多同学在学习这门课程的时候本里面各种复杂的公式吓唬住了,很少人会愿意理解这些公式背后的思想。这个系列的随笔是本人在读书过程中的一些笔记,纯属个人理解和体会,不一定是绝对的正确,但我自己会根据自己吸收到的新知识随时改进自己的理解——贝叶斯思维是个好东西。

很多童鞋在上数理统计的课程时,都会学到相关性(Correlation)这个概念,而且都会列出一个相关系数的计算公式:

而且教科书上会告诉你,当$\\\\beta=0$ 的时候,X和Y就不相关,接着会给出X和Y不相关时候对应的散点图(ScatterChart),如下:

从上图可以看出,这些点所构成的图形接近于一个圆(其实也不一定是圆形,也可能是边界连接后大致是一个对称的几何图形),但是为何当X和Y不相关的时候就会表现出这种图形呢?最近在读一本书叫How Not to Be Wrong: The Power of Mathmatical Thinking ,我认为里面就给出了一个很好的解答(作者以父亲和儿子身高的相关性作类比):

......这幅图与前面的散点图不同,没有表现出构成对角线的任何趋势。如果我们集中考虑父亲身高为73英寸的那些孩子的情况,….,就可以看出他们孩子的身高仍然会集中在69英寸周围(整体均值)。这表明孩子身高的条件期望值(也就是说,在父亲身高为73英寸时儿子的平均身高)与无条件期望值(在没有任何条件限制时儿子的平均身高)相同。

这时,在这种没有明显对焦趋势特征的散点图中,造成分布差异的很有可能仅为随机误差,这时起决定性作用的是回归平均值趋势,而不是别的因素。上述引用的那段话对什么是不相关有着很直观的阐述,它与我们日常的直观理解是一致的——别的因素的存在不会对目标产生影响,目标的波动仅仅是随机误差造成的,这类随机误差可以通过统计方法消除。

其实这里也可以写一个简单的推导,但是简书插公式太烦了,就留给大伙啦。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容