相关性检验函数

意义:

计算好相关系数之后检验其显著性

检验的意思

在某某某分析完成,得出数据之后还需要进行显著性检验来量化得到的数据是否可靠,不同的分析方法对应着不同的检验方法

相关性检验分类:

非参数检验:在总体方差未知或知之甚少的时候利用样本数据对总体分布形态等进行推断
参数检验:在总体分布形式已知的情况下对总体分布的参数如均值,方差等进行推断的方法

置信区间与置信水平:

指由由样本统计量构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间就是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果周围的程度,即被测量参数的测量值的可信程度
首先明确,置信区间就相当于误差范围,即我们根据样本得出的数据与总体真实数据之间的误差范围;而置信水平是一个概率,也就是在我们的置信区间(误差范围)里包含真实值的概率。如下图

图片.png

当我们固定一个置信水平(概率)为95%时去确定他的置信区间(误差范围)也就是规定总体真实数据落在样本数据上的概率为95%时所对应的置信区间。也说明了置信区间越小所对应的数据越可靠

T检验

适用于样本数少于30个,总体标准差未知的正态分布

cor.test函数检验(一次只能检验一组数据)

> cor.test(state.x77[,3],state.x77[,5],alternative = "two.side")#该函数(第一个需要检测的数据,第二个需要检测的数据,置信区间的检测方式默认双端检测)

    Pearson's product-moment correlation

data:  state.x77[, 3] and state.x77[, 5]
t = 6.8479, df = 48, p-value = 1.258e-08    #P值,小于0.05,显著
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.5279280 0.8207295                          #该值是95%置信水平下的置信区间
sample estimates:
      cor 
0.7029752                                            #该值是上述两个向量的相关系数

使用psych包进行检验(一次可以检验多组数据)

> library(psych)#载入包
> corr.test(state.x77)#该函数()里之间输入想要的数据框,就会输出结果
Call:corr.test(x = state.x77)
Correlation matrix         #相关系数结果
           Population Income Illiteracy Life Exp Murder HS Grad Frost  Area
Population       1.00   0.21       0.11    -0.07   0.34   -0.10 -0.33  0.02
Income           0.21   1.00      -0.44     0.34  -0.23    0.62  0.23  0.36
Illiteracy       0.11  -0.44       1.00    -0.59   0.70   -0.66 -0.67  0.08
Life Exp        -0.07   0.34      -0.59     1.00  -0.78    0.58  0.26 -0.11
Murder           0.34  -0.23       0.70    -0.78   1.00   -0.49 -0.54  0.23
HS Grad         -0.10   0.62      -0.66     0.58  -0.49    1.00  0.37  0.33
Frost           -0.33   0.23      -0.67     0.26  -0.54    0.37  1.00  0.06
Area             0.02   0.36       0.08    -0.11   0.23    0.33  0.06  1.00
Sample Size 
[1] 50
Probability values (Entries above the diagonal are adjusted for multiple tests.) #P值结果,四舍五入后的结果
           Population Income Illiteracy Life Exp Murder HS Grad Frost Area
Population       0.00   1.00       1.00     1.00   0.23    1.00  0.25 1.00
Income           0.15   0.00       0.03     0.23   1.00    0.00  1.00 0.16
Illiteracy       0.46   0.00       0.00     0.00   0.00    0.00  0.00 1.00
Life Exp         0.64   0.02       0.00     0.00   0.00    0.00  0.79 1.00
Murder           0.01   0.11       0.00     0.00   0.00    0.01  0.00 1.00
HS Grad          0.50   0.00       0.00     0.00   0.00    0.00  0.16 0.25
Frost            0.02   0.11       0.00     0.07   0.00    0.01  0.00 1.00
Area             0.88   0.01       0.59     0.46   0.11    0.02  0.68 0.00

 To see confidence intervals of the correlations, print with the short=FALSE option

使用t检验对分组数据的相关性检验

> t.test(Prob~So,data = UScrime)#~左边为数值型变量,右边为类型变量

    Welch Two Sample t-test

data:  Prob by So
t = -3.8954, df = 24.925, p-value = 0.0006506
alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
95 percent confidence interval:
 -0.03852569 -0.01187439
sample estimates:
mean in group 0 mean in group 1 
     0.03851265      0.06371269 
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容