1. 背景知识
举例来说,某研究人员收集了本市2007年确诊为轻度认知损害(MCI)的518例老年患者临床资料,包括基本人口学特征、生活方式、体格检查和合并疾病信息等,并于2010~2013年完成6次随访调查,主要观察结局为发生阿尔兹海默病(AD)。随访期间,共发生AD78例,失访84例,其中28例搬迁、31例退出、25例死亡。试问影响MCI向AD转归的因素都有哪些?本例中,如果MCI患者在观察期间死于癌症、心血管疾病、车祸等原因而未发生AD,就不能为AD的发病做出贡献,即死亡“竞争”了AD的发生。传统生存资料统计方法将发生AD前死亡的个体、失访个体和未发生AD个体均按删失数据(censored data)处理,可能会导致估计偏差[1]。对于死亡率较高的老年人群,当有竞争风险事件存在时,采用传统生存分析方法(K-M法、Cox比例风险回归模型)会高估所研究疾病的发生风险,产生竞争风险偏倚,有人专门研究发现约46%的文献可能存在这种偏倚。
本例中若选用竞争风险模型处理较为恰当。所谓竞争风险模型(Competing Risk Model)是一种处理多种潜在结局生存数据的分析方法,早在1999年Fine和Gray就提出了部分分布的半参数比例风险模型,通常使用的终点指标是累积发生率函数(Cumulative incidence function,CIF)[1-2]。本例中可以将发生AD前死亡作为AD的竞争风险事件,采用竞争风险模型进行统计分析。竞争风险的单因素分析常用来估计关心终点事件的发生率,多因素分析常用来探索预后影响因素及效应值。
2. 案例分析
2.1 [案例分析]
library(foreign)
bmt <-read.csv('bmtcrr.csv')
## 'data.frame': 177 obs. of 7 variables:
$ Sex : Factor w/ 2 levels "F","M": 2 1 2 1 1 2 2 1 2 1 ...
$ D : Factor w/ 2 levels "ALL","AML": 1 2 1 1 1 1 1 1 1 1 ...
$ Phase : Factor w/ 4 levels "CR1","CR2","CR3",..: 4 2 3 2 2 4 1 1 1 4 ...
$ Age : int 48 23 7 26 36 17 7 17 26 8 ...
$ Status: int 2 1 0 2 2 2 0 2 0 1 ...
$ Source: Factor w/ 2 levels "BM+PB","PB": 1 1 1 1 1 1 1 1 1 1 ...
$ ftime : num 0.67 9.5 131.77 24.03 1.47 ...</pre>
$ Sex : 因子变量,2个水平:“F”,“M”。
$ D : 因子变量,2个水平:“ALL(急性淋巴细胞白血病)”,“AML(急性髓系细胞白血病)”。
$ Phase : 因子变量,4个水平:“CR1”,“CR2”,“CR3”,“Relapse”。
$ Age : 年龄。
$ Status: 结局,0=删失,1=复发,2=竞争风险事件。
$ Source: 因子变量,2个水平:“BM+PB(骨髓移植+血液移植)”,“PB(血液移植)”。
$ ftime : 时间。
bmtage <- bmt
sex <- as.factor(ifelse(bmt
D <- as.factor(ifelse(bmt
phase_cr <- as.factor(ifelse(bmt
source = as.factor(ifelse(bmt$Source=='PB',1,0))</pre>
str(bmt)
## 'data.frame': 177 obs. of 12 variables:
$ Sex : Factor w/ 2 levels "F","M": 2 1 2 1 1 2 2 1 2 1 ...
$ D : Factor w/ 2 levels "0","1": 1 2 1 1 1 1 1 1 1 1 ...
$ Phase : Factor w/ 4 levels "CR1","CR2","CR3",..: 4 2 3 2 2 4 1 1 1 4 ...
$ Age : int 48 23 7 26 36 17 7 17 26 8 ...
$ Status : int 2 1 0 2 2 2 0 2 0 1 ...
$ Source : Factor w/ 2 levels "BM+PB","PB": 1 1 1 1 1 1 1 1 1 1 ...
$ ftime : num 0.67 9.5 131.77 24.03 1.47 ...
$ id : int 1 2 3 4 5 6 7 8 9 10 ...
$ age : int 48 23 7 26 36 17 7 17 26 8 ...
$ sex : Factor w/ 2 levels "0","1": 1 2 1 2 2 1 1 2 1 2 ...
$ phase_cr: Factor w/ 2 levels "0","1": 2 1 1 1 1 2 1 1 1 2 ...
$ source : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...</pre>
head(bmt)
## Sex D Phase Age Status Source ftime id age sex phase_cr source
1 M 0 Relapse 48 2 BM+PB 0.67 1 48 0 1 0
2 F 1 CR2 23 1 BM+PB 9.50 2 23 1 0 0
3 M 0 CR3 7 0 BM+PB 131.77 3 7 0 0 0
4 F 0 CR2 26 2 BM+PB 24.03 4 26 1 0 0
5 F 0 CR2 36 2 BM+PB 1.47 5 36 1 0 0
6 M 0 Relapse 17 2 BM+PB 2.23 6 17 0 1 0</pre>
regplot包中的regplot()函数可绘制较为美观的nomogram。但是,它目前只接收coxph()、lm()和glm()函数返回的回归对象。因此,为了绘制竞争风险模型的nomogram,我们需要对原数据集加权创建一个新数据集用于为竞争风险模型分析[5-6]。mstate包中的crprep()函数的功能主要在于创建此加权数据集,如下面的R代码所示。然后,我们就可以使用coxph()函数对加权数据集进行竞争风险模型拟合,然后传递给regplot()来绘制nomogram。具体加权原理读者可参考Geskus RB等人发表的文献[5],此处不表。
library(mstate)
## Loading required package: survival
df.w <- crprep("ftime", "Status",
data=bmt, trans=c(1,2),
cens=0, id="id",
df.wTstop - df.w$Tstart</pre>
m.crr<- coxph(Surv(T,status==1)~age+sex+D+phase_cr+source,
## Call:
coxph(formula = Surv(T, status == 1) ~ age + sex + D + phase_cr +
source, data = df.w, weights = weight.cens, subset = failcode ==
n= 686, number of events= 56
coef exp(coef) se(coef) z Pr(>|z|)
age -0.02174 0.97850 0.01172 -1.854 0.06376 .
sex1 -0.10551 0.89987 0.27981 -0.377 0.70612
D1 -0.53163 0.58764 0.29917 -1.777 0.07556 .
phase_cr1 1.06140 2.89040 0.27870 3.808 0.00014 ***
source1 1.06564 2.90269 0.53453 1.994 0.04620 *
Signif. codes: 0 '' 0.001 '' 0.01 '' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
age 0.9785 1.0220 0.9563 1.001
sex1 0.8999 1.1113 0.5200 1.557
D1 0.5876 1.7017 0.3269 1.056
phase_cr1 2.8904 0.3460 1.6739 4.991
source1 2.9027 0.3445 1.0181 8.275
Concordance= 0.737 (se = 0.037 )
Likelihood ratio test= 28.33 on 5 df, p=3e-05
Wald test = 28.54 on 5 df, p=3e-05
Score (logrank) test = 30.49 on 5 df, p=1e-05</pre>
library(regplot)
failtime = c(36, 60), prfail = T, droplines=T)</pre>
## Replicate weights assumed
## Click on graphic expected. To quit click Esc or press Esc
# $points.tables