今天我们来讲讲分析方法的相关系数
定义
相关分析方法的定义就是利用指标衡量两种数据间的相关程度。
1)数值大小表示两种数据的相关程度:
相关系数的绝对值越大,说明两种数据的相关程度越高。
弱相关:0~0.3
高度相关:0.6~1
2)数值正负反映两种数据的相关方向:
-:反方向变化,负相关,一种数据增大,另一种数据随之减小
+:同方向变化,正相关,一种数据增大,另一种数据随之增大
0:不是线性相关
应用场景
比如说一个APP的日活量下降,经过假设检验分析,我们了解到日活量下降的原因有三个:
1.获取用户的渠道B出现了问题
2.产品出现了闪退等问题
3.竞品对手开始了大额补贴
这三个问题都很棘手,都急需解决。但是因为公司的资源有限,只能优先解决一个问题,那么哪个问题是最优先的呢?
这里就要用到相关系数分析,我们分析后发现问题2.产品出现了闪退和日活量下降相关系数最高,所以我们知道了解决闪退问题是最优先的了。
注意事项
相关关系我们很容易和因果关系相混淆。
因果关系往往是A事件导致了B事件
而相关关系是A事件发生的同时,B事件也发生了,但是我们不能说A事件的发生导致了B事件的发生。
实际上,相关关系的发生要么是有个C事件的发生导致的,要么是纯属巧合。
那么,怎样判断是因果关系还是相关关系呢?
单一控制变量法即可,对,就是初中学的那个!~!
举个栗子:每天早上,公鸡都会打鸣,太阳都会升起。那么这两者之间是啥关系呢?
我们把公鸡炖了,太阳依然会照常升起。
所以这不是因果关系,属于相关关系。
CTR技术建立在相关关系分析的基础上的,大部分时候我们往往无法找到直接的因果关系,当必须找到原因时:先找到相关关系,再通过实验找到因果关系。
最后打个小广告,我的微信公众号:顾先生的数据挖掘
喜欢的小伙伴可以关注下,你的关注是我最大的动力!