来自于Simple Learning Pro的系列
相关性
为了描述两个变量之间的相关关系,我们一般可以采用散点图用于描述。
这两个变量,我们把其中一个称为解释变量,也是自变量;一般放于X轴;另一个称为自变量,一般放于Y轴
描述相关性(r)时有两个要素:
相关性的方向:正相关 or 负相关
相关性的强弱:越接近于1/-1表示相关性越强
回归方程和R-squared
为了对两个变量之间的相关关系做更好的描述,我们可以引入回归方程;
Y=b0+b1*X;其中b0为截距,b1为相关系数
同时我们引入R-squared(上文中r的平方)来反映回归方程整体的拟合度,表达因变量与所有自变量之间的总体关系。R²等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比。
残差
残差:观测值与拟合值的偏离,残差大小可以衡量预测的准确性;
在回归中也要注意异常值点