What?
Data Cut Off 数据截止,将数据锁定在某个特定时间点,之后的数据不纳入分析。
Why?
在一些肿瘤试验或者其它长期试验中,研究过程中有该适应症的新药上市,治疗失败或者疾病进展的患者大概率会用新药物治疗,如果收集了这类数据,那么就不能很好评价试验药物的疗效了。
这时,如果设置恰当的cutoff date,不纳入后续数据分析,即可;
需要期中分析的试验,试验过程中数据还是不断收集,EDC系统不断在录入数据,但是期中分析报告需要说明是什么节点的数据。这时,也会需要date cutoff;
另外预设的某个milestone发生了,比如双盲期疗效数据收集完毕、需要进行适应性试验设计的样本量重估、研发期间安全性更新报告(DSUR)更新等等。
How?
一般来说 有两种cutoff方式:
- 固定date的cutoff
DSUR的更新 - 按照访视cutoff
比如一项研究,双盲期A、B药分组服用,双盲期结束后(揭盲)进入开放期,出于伦理给患者服用疗效更好的A药,如果想要双盲期的结果用于递交,那么每个患者则按照访视cutoff选则开放期开始前的所有访视记录。
按访视cutoff与按date cutoff类似,以下以date cutoff为例说明。
一旦确定好DCO,PM会催促CRC尽快录入截止日期前的数据,DM会在DCO后的一段时间进行数据清理,在这期间EDC系统仍然可能会录入数据,但是DM清理只集中在DCO之前的数据,所有会存在DCO之后的脏数据。SAS programmer的工作流程:RAW➡SDTM➡ADaM,因此cutoff也有两种方式:
- 在SDTM进行cutoff
- SDTM保留原始数据,在ADaM阶段进行cutoff
以上两种方式均有利有弊。
支持1方式的观点:SDTM ADaM均是DCO数据,提高了data traceability,而且这样不会有DCO后的dirty data进到SDTM。
支持2方式的观点:SDTM只作为原始数据的标准化版本,不进行数据的删除。ADaM作为分析数据集可以进行衍生、保留分析记录等等操作的原则进行cutoff。SDTM保留了所有原始数据,避免信息丢失。
(以上观点来自共事过的同事、领导、以及某行业会议上Victor(吴崇胜)的分享)
仅从sas编程的角度出发,从SDTM进行cutoff是更为简单的。在ADaM阶段进行cutoff 可能会出现,同一个信息在不同SDTM Domain出现需要多次cutoff的情况。比如死亡页面,在DD domain需要DTHDTC,
DM domain也需要DTHDTC;比如不良事件,在AE domain记录AETERM AESTDTC等,可能会在FA domain记录该AE伴随的一些其它特征,FAOBJ FADTC。个人更支持从SDTM就进行cutoff。
具体的cutoff rules
基本的原则
对于日期完全缺失的记录,无法判断与DCO的前后关系,一般原则,是进行保留,比如未知开始日期的AE,保守原则考虑会被纳入TEAE进行汇总分析。
对于部分缺失的日期,如果明确是在DCO之后的,不纳入。否则保留。
DCO | DTC | include? |
---|---|---|
2024-09-15 | 2024-08 | ✔ |
2024-09-15 | 2024-09 | ✔ |
2024-09-15 | 2024-10 | ❌ |
具体规则
- 按访视收集的数据
按检查日期进行cutoff
milestone数据:入组、随机、知情同意、死亡等按相应日期进行cutoff - 不良事件、合并用药数据
存在开始日期和结束日期的数据,不保留开始日期在DCO之后的记录,如果结束日期在DCO之后,可将相应的结束日期、转归等置空,另外若AE升级为SAE的日期在DCO之后,也可将其置空、AESER也置空等等;另外的做法是仅对开始日期在DCO之后的记录剔除,结束日期等其它信息不做处理,进行保留,这样做保留了更多的信息,但对于这种做法,可能会保留未清理的数据,(DM基于DCO清理数据,对于这种DCO之后录入的数据可能存在data issue)。