1. 相关:
- 定义:描述个体变量之间的关系
- 意义:自己理解,x与y的变化关系.
- 标记:使用r进行表示
2. 描述相关的要点
- 正负:正相关,负相关
- 相关形式:线性,非线性
- 相关大小:接近1或者-1,越相关
3. 决定系数
- r^2,描述了y的变异性可以由x的多少百分比进行决定
- 与效应量的r^2(方差百分比)的含义类似
- 方差百分比的含义:经过处理的效应(变异性),占未处理变异性的百分比.
4. 皮尔逊相关
- 描述了两个变量间,线性的相关关系
- 公式的含义: (XY的共同变化的程度) / (X,Y单独变化的程度)
- 共同变化的程度,使用SP(离差积)
- 单独变化的程度,使用SS
- 算出的结果为r
4. 斯皮尔曼相关
- 可以描述线性,非线性的相关
- 原理: 将变量进行排序,相同变量使用一个序号.对排序之后的序号,使用"皮尔逊"相关.
5. 对于相关的迷思
- 相关不等于因果:相关只是描述了两个变量之间有联系,但是没有解释变量之间为什么有联系
- 相关的值受奇异值的影响
- 相关的的值受到全距的影响
- r描述了相关的大小,r^2描述了精准的预测
5. 相关的假设检验
- 为什么要假设检验:当样本为非0相关时,看总体是否相关
- 假设检验的目的:
1. 接受H0: 样本的非0相关是由偶然引起的
2. 拒绝H0: 样本的非0相关代表了总体的精确相关. - 如何假设检验: 拿到样本自由度df = n-2,α水平,查表得到相关范围.
6.总结
- 相关的作用主要是预测,给回归提供可以可被解释变异性的百分比.
- 异常值,非全距值,会改变相关
- 相关不代表因果