MNAR下的填补方法:
-
Reference-based imputation
-
J2R(Jump to Reference)
受试者缺失前的均值向量仍为试验组,但退出治疗后,采用对照组的均值分布。因此,对于有缺失记录的受试者,它的均值及协方差矩阵综合了已观测到的试验组+缺失后对照组的结果。对于对照组来说,缺失值填补基于MAR。该方法假定试验组受试者一旦停止治疗,试验组带来的疗效立刻消失,停止治疗后的缺失数据与对照组类似。
-
CIR(Copy Increments in Reference)
受试者缺失前的均值向量仍采用试验组,缺失后采用对照组但需考虑缺失所在时间点的试验组疗效作为增量,即缺失后的数据趋势与对照组类似但以缺失所在点作为起点。CIR的方差-协方差矩阵同J2R。对照组缺失,仍采用基于MAR的填补。该方法假设受试者停止治疗后,疗效仍然存在,后续采用对照组治疗。
-
CR(Copy Reference)
该方法假设退出治疗受试者的整个分布,包括缺失前及缺失后,无论退出所在的时间点,均参照对照组的分布。对照组缺失,仍采用基于MAR的填补。对于随机错误的受试者,可以采用这个方法。
-
其他方法:
- Delta-adjusted
- Tipping point analysis
MNAR下缺失数据处理的实现方式,包括
1.Sequential modeling method-Ratich and O’Kelly(2011)
PMMs框架下的方法,通过SAS中的Proc MI步实现。基于单调回归填补(Monotone Sequential Regression),而非联合概率分布(Joint distribution)。
(1)每次仅填补一个缺失访视点的数据。
(2)每次仅包括试验组缺失访视点t的受试者及对照所有的数据。因此试验组有时刻t的受试者没有被包含在数据集中,因此试验组数据不会参与到该缺失数据点的填补。
(3):重复填补步骤填补各个不同的时间点。
优点:方法的逻辑和步骤比较清晰,没有复杂的计算和编程过程,不需要使用IML编程。同时Proc MI步中允许通过class=声明,而proc MI中无法声明Class=语句(分类变量也会近似基于多元正态分布)。
*PMMs里的pattern指共有某一特征的人群自己,而Proc MI里的pattern指的是缺失模式monotone or non-monotone。
- 参考文献:Implementation of Pattern-Mixture Models Using Standard SAS/STAT Procedures(2011)
2. Joint distribution modeling method-Roger (2008)
Joint Modeling比SRI的实现方法复杂很多,需要基于模型的假设对受试者缺失前及缺失后的均值向量及方差-协方差矩阵进行处理,之后再产生填补数据。参考文献Reference-based Sensitive analysis via multiple imputation for longitudinal trials with protocol deviation里的步骤:
假设某随机对照临床试验,i=1...n个受试者,Ti为第i个受试者对应的组别,j=0...J为第j次观测时间,j=0为基线,第i个受试者的第j次观测表示为。假设所有受试者基线均有数据,为基线后最后一次观测结果,因此可取。
为已观测数据,为缺失数据。对于有缺失的受试者,缺失数据表示为,η为在填补之前必须估计出来的参数。
为了获取参数η,需要假定一个模型。对于连续数据,假定一个非结构化的多元正态分布(unstructured Multivariate normal model),每个组的每个时间点均值向量以及非结构化的协方差矩阵(unstructured covariates matrix),用以描述重复观测之间的相关性。
具体步骤:
a. 对每个组的所有已观测到的数据,假定MAR模型,拟合一个非结构化均值(即基线及基线后的均值各不相同)以及非结构化的方差协方差矩阵的MVN模型(Multivariate Normal Distribution),采用贝叶斯方法,采用一个improper先验产生unstructured mean,方差协方差矩阵采用uninformative Jeffreys 先验。
b. 从步骤1后验分布中产生每个组的均值及方差协方差矩阵,采用MCMC。
c. 通过步骤2的结果产生缺失受试者的联合概率分布。这个过程中可以基于不同的假设产生该联合概率分布,如J2R、CR、CIR等。
d. 采用步骤3中的联合概率分布构建缺失数据的条件概率分布,完成缺失数据的填补结果并构建完整的填补数据集
e. 重复2-4的步骤,产生m个填补数据集。
该方法的实现:
SAS中没有现成的命令实现基于Joint modelling的上述填补方法。https://www.lshtm.ac.uk/research/centres-projects-groups/missing-data#dia-missing-data 网站上提供了关于Joint modeling下CR、CIR、J2R等方法的实现,但是程序步骤比较复杂。文献3中提供了采用SAS IML计算的实现方法。文献2里给出了基于Stata-mimix的实现方法。
参考文献:1. Analysis of Longitudinal Trials With Protocol Deviations: A Framework for Relevant, Accessible Assumptions, and Inference via Multiple Imputation. -Carpenter, Roger, and Kenward
2. Reference-based Sensitive analysis via multiple imputation for longitudinal trials with protocol deviation
3. An Efficient Multiple Imputation Algorithm for Control-Based and Delta-Adjusted Pattern Mixture Model using SAS-by Yongqiang Tang