R语言有序多分类Logistic回归

        常见的二分类结局变量,如事件是否发生、是否死亡等,我们可以用二分类logistics回归分析结局变量和自变量因素之间的关系,在R语言中也很容易实现,结果也非常容易解释。但有时候我们会遇到这样的结局指标,如病情的严重程度、对服务质量的评价、患者满意度等,这些指标都是有序的都分类指标,如轻度、中度、重度;差、一般、好等。此时,如果要探究结局变量的影响因素,就会用到有序多分类Logistic回归(Ordinal Logistic Regression)。这里我们以一个简单的例子介绍在R中如何进行有序Logistic回归的分析。

              我们一个500人的数据,变量有年龄(Age)、性别(Sex)、血压(blood.pressure)和自评的健康状况(outcome,差、一般、好)。要分析自评的健康状况的影响因素,我们要用到有序多分类Logistic回归。在R语言中完成这个过程:

#####载入需要的包

install.packages("MASS")

install.packages("brant")

library(MASS)

library(brant)

###生成模拟数据

n <-1000  # define sample size

set.seed(2022) # so can reproduce the results

age            <- rnorm(n, 60, 10)

blood.pressure <- rnorm(n, 125, 15)

sex            <- factor(sample(c('female','male'), n,TRUE))

outcome<- factor(sample(c(1,2,3),n,TRUE),levels = c("1","2","3"),

                  labels = c("poor","fair","good"))

data<-data.frame(age,blood.pressure,sex,outcome)

head(data)

#####单因素分析------------

fit0<-polr(ordered(outcome)~ 1, data=data)#####空模型

fit1<-polr(ordered(outcome)~ +sex, data=data)

summary(fit1)


#####平行线检验---

brant(fit1) ###p>0.1,满足平行线检验


####检验模型整体是否有意义

anova(fit0,fit1)  ####p=0.0687,接近有意义


#####生成OR、95%CI和P值

#####生成OR、95%CI和P值

OR<-round(exp(fit1$coefficients),2)

CI <- round(exp(confint(fit1)), 2)

CI<-data.frame(CI[1],CI[2])

colnames(CI) <- c("Lower", "Higher")

P <- (pnorm(abs( coef(summary(fit1))[,"t value"]),lower.tail = FALSE)*2)[1]

out<- as.data.frame(cbind(OR, CI, P))

out

#####输出的即为我们需要的OR、95%CI和P value

######多因素分析,方法类似-----------------------------

fit2<-polr(ordered(outcome)~ +sex+age+blood.pressure, data=data)

summary(fit2)


#####平行线检验---

brant(fit2) ###p>0.1,三个变量都满足平行线检验


####检验模型整体是否有意义

anova(fit0,fit2) 

#####生成OR、95%CI和P值,和单因素的有些区别

OR_CI<-exp(cbind(OR=coef(fit2),confint(fit2)))

colnames(OR_CI) <- c("OR","Lower", "Higher")

P <- (pnorm(abs( coef(summary(fit2))[,"t value"]),lower.tail = FALSE)*2)

P


#TI

P<-P[1:3] ###提取前三个

out<- as.data.frame(cbind(OR_CI, P))

out


######结果输出即可

write.table(out, file ="/STR_2.csv", sep = ",",    col.names = NA,qmethod = "double",append=TRUE)    

            得到结果后如何解释呢,以性别为例(仅解释结果,先暂时忽略掉其没有意义),我们可以说:“和女性相比,男性对自身的健康状况评价更低 (OR=0.82, 95%CI=0.65-1.02)”,或者是“男性认为自身健康好的OR值是女性的0.82倍 (OR=0.82, 95%CI=0.65-1.02)”。

           总结以上,对于有序多分类结局变量,我们可以用有序多分类Logistic回归,但是要满足平行线假设的条件,如果不满足的话,可以用无序多分类Logistic回归或者转化为二分类Logistic回归。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容