Data Cut Off

What?

Data Cut Off 数据截止,将数据锁定在某个特定时间点,之后的数据不纳入分析。

Why?

在一些肿瘤试验或者其它长期试验中,研究过程中有该适应症的新药上市,治疗失败或者疾病进展的患者大概率会用新药物治疗,如果收集了这类数据,那么就不能很好评价试验药物的疗效了。
这时,如果设置恰当的cutoff date,不纳入后续数据分析,即可;
需要期中分析的试验,试验过程中数据还是不断收集,EDC系统不断在录入数据,但是期中分析报告需要说明是什么节点的数据。这时,也会需要date cutoff;
另外预设的某个milestone发生了,比如双盲期疗效数据收集完毕、需要进行适应性试验设计的样本量重估、研发期间安全性更新报告(DSUR)更新等等。

How?

一般来说 有两种cutoff方式:

  • 固定date的cutoff
    DSUR的更新
  • 按照访视cutoff
    比如一项研究,双盲期A、B药分组服用,双盲期结束后(揭盲)进入开放期,出于伦理给患者服用疗效更好的A药,如果想要双盲期的结果用于递交,那么每个患者则按照访视cutoff选则开放期开始前的所有访视记录。

按访视cutoff与按date cutoff类似,以下以date cutoff为例说明。

一旦确定好DCO,PM会催促CRC尽快录入截止日期前的数据,DM会在DCO后的一段时间进行数据清理,在这期间EDC系统仍然可能会录入数据,但是DM清理只集中在DCO之前的数据,所有会存在DCO之后的脏数据。SAS programmer的工作流程:RAW➡SDTM➡ADaM,因此cutoff也有两种方式:

  • 在SDTM进行cutoff
  • SDTM保留原始数据,在ADaM阶段进行cutoff

以上两种方式均有利有弊。

支持1方式的观点:SDTM ADaM均是DCO数据,提高了data traceability,而且这样不会有DCO后的dirty data进到SDTM。

支持2方式的观点:SDTM只作为原始数据的标准化版本,不进行数据的删除。ADaM作为分析数据集可以进行衍生、保留分析记录等等操作的原则进行cutoff。SDTM保留了所有原始数据,避免信息丢失。

(以上观点来自共事过的同事、领导、以及某行业会议上Victor(吴崇胜)的分享)

仅从sas编程的角度出发,从SDTM进行cutoff是更为简单的。在ADaM阶段进行cutoff 可能会出现,同一个信息在不同SDTM Domain出现需要多次cutoff的情况。比如死亡页面,在DD domain需要DTHDTC,
DM domain也需要DTHDTC;比如不良事件,在AE domain记录AETERM AESTDTC等,可能会在FA domain记录该AE伴随的一些其它特征,FAOBJ FADTC。个人更支持从SDTM就进行cutoff。

具体的cutoff rules

基本的原则

对于日期完全缺失的记录,无法判断与DCO的前后关系,一般原则,是进行保留,比如未知开始日期的AE,保守原则考虑会被纳入TEAE进行汇总分析。
对于部分缺失的日期,如果明确是在DCO之后的,不纳入。否则保留。

DCO DTC include?
2024-09-15 2024-08
2024-09-15 2024-09
2024-09-15 2024-10
具体规则
  • 按访视收集的数据
    按检查日期进行cutoff
    milestone数据:入组、随机、知情同意、死亡等按相应日期进行cutoff
  • 不良事件、合并用药数据
    存在开始日期和结束日期的数据,不保留开始日期在DCO之后的记录,如果结束日期在DCO之后,可将相应的结束日期、转归等置空,另外若AE升级为SAE的日期在DCO之后,也可将其置空、AESER也置空等等;另外的做法是仅对开始日期在DCO之后的记录剔除,结束日期等其它信息不做处理,进行保留,这样做保留了更多的信息,但对于这种做法,可能会保留未清理的数据,(DM基于DCO清理数据,对于这种DCO之后录入的数据可能存在data issue)。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容