文/伢赞
(一)
相关量数用于描述双变量数据相互之间的关系,一般来说,事物之间有三种关系:因果关系,共变关系和相关关系。其中因果关系是指一种现象是另一种现象的原因。共变关系指的是表面上看起来有联系的两种事物,都与第3种现象有关。相关关系指的是事物之间存在着联系,但又无法确认是因果关系或共变关系。
相关的类别有三种,正相关,负相关和零相关,正相关指的是两个变量变动方向相同,同增同减。负相关指的是两个变量变动方向相反,一增一减或一减一增。零相关是指两个变量之间没有联系,一个变量变动时另一个变量做无规律的变动。
相关系数是指两个变量间相关关系强度的数量化指标,作为样本统计量用R表示,作为总体参数用希腊字母ρ表示。取值范围是-1~1之间。
相关系数的注意事项
一,相关系数的正负号表示相关的方向,绝对值大小表示相关的程度。
二,相关系数的绝对值越大,表示相关程度越密切,但需要注意的相关系数受样本容量的影响,如果样本容量N很小,可能完全没有关系的两个事物之间也能计算出较大的相关系数,因此要求样本容量N≧30。
三,0相关不一定意味着两个变量没有关系,两边的关系也可能是非线性的。
四,两个变量相关并不能得出二者存在因果关系。
五,相关系数只能比较大小,不能用倍数关系说明。
(二)积差相关
前提:
一,数据要成对出现,若干个个体中,每个个体都有两种不同的观测值,并且每对数据与其他对数据相互独立。
二,两列变量各自总体的分布都是正态的,至少接近正态分布。
三,两个相关的变量是连续的变量。
四,两个变量之间的关系应该是线性的。
五,样本的容量至少要大于等于30。
(三)等级相关
斯皮尔曼等级相关对数据进行了降级的处理。它属于等级相关的一种,适用于成对的两列变量,具有线性关系的资料。
(四)肯德尔等级相关
肯德尔W系数适用于等级评定法,让K个评价者对N个事物进行等级评价。另一种情况是一个评价者先后K次评价N件事物或作品。
肯德尔U系数适用的资料是采用对偶比较的方法,将N件事物两两配对,然后对每一对中两个事物进行比较,择优选择。优者记一,非优者记零,最后整理成相对应的评价结果。
(五)点二列相关与二列相关
点2列相关适用的资料是,一列数据为连续正态等距或等比变量,另一列为离散型的二分变量。不是人为的。
二列相关适用于两列变量都是连续正态等距或等比变量,但其中一列变量被人为的分成两部分。
(六)Φ相关
主要用于表示R×C表的两个变量之间的关联程度的相关是品质相关,包括4分相关,Φ相关和列表相关,其中Φ相关较为常见。
以上就是今天的学习内容。