简单理解统计学4-因变量、自变量与相关性

来自于Simple Learning Pro的系列

相关性

为了描述两个变量之间的相关关系,我们一般可以采用散点图用于描述。
这两个变量,我们把其中一个称为解释变量,也是自变量;一般放于X轴;另一个称为自变量,一般放于Y轴

描述相关性(r)时有两个要素:
相关性的方向:正相关 or 负相关
相关性的强弱:越接近于1/-1表示相关性越强

相关性

回归方程和R-squared

为了对两个变量之间的相关关系做更好的描述,我们可以引入回归方程;
Y=b0+b1*X;其中b0为截距,b1为相关系数

同时我们引入R-squared(上文中r的平方)来反映回归方程整体的拟合度,表达因变量与所有自变量之间的总体关系。R²等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比。

回归方程

残差

残差:观测值与拟合值的偏离,残差大小可以衡量预测的准确性;

在回归中也要注意异常值点

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容