分类变量的模型估计值与分类变量的赋值有关系,同样的命令下,不同的变量赋值将会导致不同的结果。
假设一个混合效应的泊松回归模型为:
分类变量的赋值:
- Group=0 -> 对照组
- Group=1 ->试验组,
- Visit=0/1/2/3
即对照组及基线均赋值为0。则:
- exp(β_0)代表对照组基线时的平均发生率。
此时group=0、visit=0 - exp(b0i+β0)代表第i个受试者对照组基线时的发生率。
此时group=0、visit=0 - exp(β_1)代表试验组与对照组在基线时的发生率之比。
group=0、Visit=0时:
group=1、Visit=0时: - exp(β_{2j})代表对照组第j次访视时与基线的发生率之比
group=0、Visit=0时:
group=0、Visit=j时: - exp(β{2j}+β{3j})代表试验组第j次访视时与基线的发生率之比
group=1、Visit=0时:
group=1、Visit=j时:
在SAS中的表示:
e.g.
title "Two-way ANOVA Model, Kutner (1974, p.98)";
data a;
input drug disease @;
do i=1 to 6;
input y @;
output;
end;
datalines;
1 1 42 44 36 13 19 22
1 2 33 . 26 . 33 21
1 3 31 -3 . 25 25 24
2 1 28 . 23 34 42 13
2 2 . 34 33 31 . 36
2 3 3 26 28 32 4 16
3 1 . . 1 29 . 19
3 2 . 11 9 7 1 -6
3 3 21 1 . 9 3 .
4 1 24 . 9 22 -2 15
4 2 27 12 12 -5 16 15
4 3 22 7 25 5 12 .
;
proc glm data=a;
class drug disease;
model y=drug disease drug*disease;
lsmeans drug/pdiff;
run;
此时模型表示为;
假设需要检验drug1+2 vs. drug3+4,则对应语句为
estimate “Drug pair 1,2 vs drug pair 3,4" drug 1 1 -1 -1 / divisor=2;
假设需要检验drug3的均值为0,则对应语句为
estimate “Drug 3 mean" intercept 1 drug 0 0 1 0;
假设需要检验针对disease2,drug1的均值等于drug2的均值
estimate "Drug 1 disease 2 vs drug 2 disease 2" drug 1 -1 drug*disease 0 1 0 0 -1;
需要特别注意的是,在contrast和estimate语句中,制定主效应(drug)的系数等同于平均higher-ordered effect(drug * disease interaction),
因此
estimate "drug 3 mean" intercept 1 drug 0 0 1 0; 等同于设定drug * disease的系数为:
estimate "drug 3 mean
intercept 1 drug 0 0 1
drug*disease 0 0 0
0 0 0
0.333333 0.333333 0.333333
0 0 0;
文献:
<Repeated Measures Design with Generalized linear mixed model for RCTs> 1.2.2节
<CONTRAST and ESTIMATE Statements Made Easy: The LSMESTIMATE Statement>