协方差:
对于要描述两组data的相关性,求平方和并不是个好方法进一步说,我们引入cross-product deviations这个概念,即一组data的方差和另一组data的离差和同号(同为正或负),那它们乘积的结果为正;若两组data异号,则它们乘积的结果为负。我们就可以用正负号及数值大小来描述两组data之间的关系
如图,两个变量呈现正相关
如图,两个变量呈现负相关
如图,两个变量呈现不相关
协方差的计算公式:
相关系数:
相关系数目的就是消除协方差带来的量纲,并且把他限定在[-1,1]这个区间里,负数是负相关,正数是正相关,0是不相关。这样便于观测比较多组别的相关性强弱
相关系数计算公式: