在上一节线性回归内容中,我们提到了多元线性回归
例如下图中,左边是一元线性回归,右边是二元线性回归,中间为体长观察值的均值。
通过计算R2, 可以得知每一种回归模型对于体长的解释程度。
但是如何判断,在回归模型中,增加的尾巴长度这个变量,是否会使得体长预估更为精确呢?
无论是一元回归,还是多元回归,我们都可以通过F值计算每一个回归模型的P值。如果不是很清楚这部分内容,可以回顾上一节线性回归。
如果将上图F值公式中,SS(mean)和pmean对应体长均值模型数据,SS(fit)和pfit对应不同回归模型的数据。(注意这里的p是指自由度,不是P值)
思考一下,我们现在获得回归模型fit,需要评价一下这个模型的优劣。因此,需要将fit同mean做比较。
现在想要评价Multiple regression对比Simple regression的优劣,如何处理呢?
OK,如果将SS(mean)/pmean置换为SS(simple)/psimple,SS(fit)/pfit置换为SS(mutilple)/pmultiple,我们就可以直接在多元回归模型和一元回归模型之间做比较了。
如果R2multiple大于R2simple,同时P值小于0.05的话,那么增加尾巴长度这个变量,对于体长的预估是有利的。
申明
本文是根据StatQuest系列视频整理而来
已获得Josh Starmer授权说明
感谢久久琼殷不辞辛苦将视频转载至B站
Permmsion