R语言机器学习与临床预测模型72--相关性分析方法总结

R小盐准备介绍R语言机器学习与预测模型的学习笔记

你想要的R语言学习资料都在这里, 快来收藏关注【科研私家菜】


01 相关性分析

相关性分析用于评估两个或多个变量之间的关联。例如,如果我们想知道父亲和儿子的身高之间是否存在关系,可以计算相关系数来回答这个问题。
相关性分析解决以下两个问题:
判断两个或多个变量之间的统计学关联;
如果存在关联,进一步分析关联强度和方向

相关分析的方法有多种:包括皮尔逊(Pearson)相关(r),它测量两个变量(x和y)之间的线性相关性。它也称为参数相关性检验,因为它取决于数据的分布。仅当x和y来自正态分布时才可以使用它。y = f(x)的图称为线性回归**曲线。

  • Kendall tauSpearman rho,它们是基于等级的相关系数(非参数)。

最常用的方法是Pearson相关方法。

相关性方法:
Pearson相关系数(适用于定量数据,且数据满足正态分布)


Spearman相关系数(数据不满足正态分布时使用) Kendall's tau -b相关系数(有序定类变量)


针对一组数据,想要研究其中的相关关系,首先要做的是正态性检验,如果数据满足正态分布,使用Pearson相关系数,否则使用Spearman相关系数。
相关性的分析主要是看p值,如果p值小于0.05,则呈现显著性,说明两变量之间存在相关性。


02 Cochran's Q 检验

Cochran's Q 检验 用于三个字段以上的二分类定类数据的一致性检验,即相关程度分析。

Cochran's Q 检验主要是看p值,如果p值小于0.05,则呈现显著性,说明两变量之间存在相关性。

03 Kappa一致性检验

Kappa一致性检验 用于定类数据的相关性检验。
一般Kappa系数可用于衡量分类精度,或者投票等定类数。
方法包括:
简单Kappa:适用于两两纯定类数据(无序)
线性加权Kappa:适用于两两有序定类数据
平方加权Kappa:同线性加权,但加重了有序定类的级别差异
Flesis Kappa:适用于三组以上的定类数据

相关性看p值, <0.05,呈显著性,说明两变量之间存在相关性
Kappa 值的大小代表的相关性解释:


04 Kendall协调系数

肯德尔(Kendall)协调系数用于三组以上定类数据的相关性检验,与此类似的有Kappa系数一致性检验。这两者不同的是:Kappa系数与皮尔逊一样是比较两项之间的相关性;而Kendall系数用于判断总体(全部数据)的相关性,适用于数据是多列相关的等级资料,即可是k个评分者评(N)个对象,也可以是同一个人先后k次评N个对象。通过求得kandall和谐系数,可以较为客观地选择好的作品或好的评分者。

相关性看p值, <0.05,呈显著性,说明两变量之间存在相关性
Kendall值的大小代表的相关性解释与Kappa一致


Kendall系数一致性检验的结果显示,总体数据的显著性 值为0.745,水平上不呈现显著性,不能拒绝原假设,因此数据不能呈现一致性,同时模型的Kendall协调系数 值为0.049,因此相关性的程度为极低的一致性。 可见五位评委对景点的评分不具有一致性。

05 组内相关系数

组内相关系数衡量和评价观察者间信度和复测信度的信度系数指标。通常可以用于问卷调查中评价一个对象对多个样本在一段时间的重测信度,或者判断一批对象对多个样本的一致性检验(定量定类均可)

ICC类型:
Two-way random/mixed absolute agreement:考虑了系统误差(如测量不同评委是否会给予相同选手的相同的打分)
Two-way randomfmixed consistency:不考虑系统误差(如测量不同评委给予相同选手的打分是否高度相关)
One-way random absolute agreement:用于检验每一个选手的均值是否完全相等(如相同评委在不同次数是否会给予相同选手的相同的打分)

判断方法:

1.选择测量方式,其中单个测量的是基于原始数据,而平均测量是基于原始结果经过均值或者中位数等方式处理;
2.分析组内相关系数对应测量方式的方差分析(P值),方可进行组内相关系数;
3.若方差分析呈现显著性(P<0.05),分析组内相关系数的效应程度,一般认为信度系数低于0.4,表示信度较差,大于0.75表示信度良好,对于定量资料常常需要更高的ICC值;



针对单个测量的组内相关系数结果显示,显著性 值为 0,水平上呈现显著性,拒绝原假设,说明信度的一致性是可信的。且相关系数为 0.957,说明该数据的信度是很强。
针对平均测量的组内相关系数结果显示,显著性 值为 0,水平上呈现显著性,拒绝原假设,说明信度的一致性是可信的。且相关系数为 0.991,说明该数据的信度是很强。

06 R语言实现

# 导入R内自带的mtcars数据集
library(datasets)
data(mtcars)
# 将数据存储在变量my_data中
my_data <- mtcars
cor(my_data$mpg,my_data$wt,method="pearson",use="complete.obs")
[1] -0.8676594
cor.test(my_data$mpg,my_data$wt,method="pearson",use="complete.obs")

    Pearson's product-moment correlation
data:  my_data$mpg and my_data$wt
t = -9.559, df = 30, p-value = 1.294e-10
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.9338264 -0.7440872
sample estimates:
       cor 
-0.8676594

x <- mtcars$wt
y <- mtcars$mpg
plot(x, y, main = "Main title",
     xlab = "X axis title", ylab = "Y axis title",
     pch = 19, frame = T)
# 添加回归线
abline(lm(y ~ x, data = mtcars), col = "red")

library(psych) #加载R包
corr.test(mtcars) #计算相关系数及其显著性
#另外我们也可以绘制相关系数图
data <- corr.test(mtcars)
r <- data$r
p <- data$p
corPlot(r,pval=p,numbers=TRUE,diag=FALSE,stars=TRUE)



关注R小盐,关注科研私家菜(VX_GZH: SciPrivate),有问题请联系R小盐。让我们一起来学习 R语言机器学习与临床预测模型

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354

推荐阅读更多精彩内容