如何开始做CDISC SDTM Domains?

最近有新入行的读者小朋友开始做CDISC domain了,来求助我流程如何,先做什么,再做什么,需要注意什么等等,就在这里答复一下吧!
“CDISC的前世今生”会努力在后面的文章更新,今天就简明扼要地告诉刚开始做项目的新人小朋友如何更快地开始sas programming之路吧。

打开CDISC的官网(https://www.cdisc.org),可以看到这里有很多标准,不过对于临床试验SP来说,我们用得最多的基本是SDTM、ADaM,其他几乎用不到或者用得很少。我们注册一个账号登录之后就可以下载里面的文档。首先,下载一个SDTM IG 3.4, SDTM IG目前已经更新到3.4版本(2021-11-29发布)了,FDA于2023-12-23宣布接受SDTM IG 3.4。Global的项目可以使用最新标准了,国内虽然还没正式要求实施CDISC标准,但CDE也是鼓励申办方以CDISC标准递交试验数据和资料的,大型CRO、药企基本上也都是Follow CDISC标准做项目的。

翻开SDTM IG 3.4,400多页,看起来有点劝退,哈哈哈哈哈🤣。其实不用担心,我们没有必要(主要是没有时间)通读并理解所有的内容,在做项目的过程中,不断地查阅、理解就可以了。有摸鱼的时间,可以读一读前四章,了解整个SDTM标准的概念,通用的基本原则,域模型的假设等,可以对整个SDTM标准有整体的理解。

SDTM Domains/Datasets主要分为以下2类(仅列举几个例子):

  • The General Observation Classes(通用观测类)

    • Interventions(干预类):EX(药物暴露)、CM(合并用药)
    • Events(事件类):AE(不良事件)、CE(临床事件)
    • Findings(发现类):EG(心电图)、LB(实验室检查)
  • Datasets Other than General Observation Class Domains(非通用观测类)

    • Special-purpose Domains(特殊目的域):DM SE SV CO SM
    • Trial Design Model Datasets(试验设计数据集):TA TE TV TD TM TI TS
    • Representing Relationships Datasets(关联数据集):RELREC RELSUB


  • Trial Design Model Datasets:去描述该试验计划要做什么,将会收集什么样的数据,以及试验目的等信息,是Study Level的信息,不需要等到有数据之后才开始编程,其中大多数内容都来自方案的描述。

  • 编程的顺序通常如下:Trial Design → DM → SE → SV → Others → CO RELREC。因为在各个SDTM域中,有一些变量需要在几个Domains都存在需要保持一致,有的变量会在其他Domain参与计算,所以需要先生成。比如:TA的ARM也是DM的Req变量,需要保持一致。TV和SV中的VISIT,TI和IE的IETEST。其他Domains会用到DM、SE、SV:涉及到日期的domains,有以下变量基于RFSTDTC计算的研究日变量:--STDY、--ENDY、--DY,需要用到DM;需要做EPOCH的domains,需要用到SE;涉及到访视的domains,需要用到SV。

  • CO是放所有页面的备注信息,如果相关内容是各个domain做一个临时的变量存放,CO直接整合,那CO就需要最后再跑。如果CO是从各个raw data提取备注,那就无需在最后做。

  • RELREC是放所有的关联关系,需要各个domain的--SEQ, --SPID, --GRPID等标识变量做ID variable,一般需要等其他domains ready,再进行编程。


在进行SDTM编程之前我们需要以下文件:Protocol、SAP、CRF、Raw Data,参考资料: SDTM IG。

做SDTM主要是follow CDISC标准进行raw data的规范化和标准化,不会有太多的衍生、填补操作,所以SAP用得不多,Protocol主要是做Trial Design用得多一些。

CRF是DM从数据库系统导出的文件,可以如下格式: blank/annotation CRF, unique/all CRF,组合数可以导出4种格式的CRF。blank/annotation CRF区别在于是否有标注,也就是在CRF标注出了数据库中的变量名,这样我们对照着看CRF和Raw Data,可以明确知道CRF收集的信息都存放在了数据库的哪个变量。



unique/all CRF对于同一个CRF页面可能在很多访视都需要收集,所以所有页面的CRF是很庞大的,但是这些重复的页面其实只保留一个就可以,所以通常我们用Unique CRF。

做SDTM domains/datasets的流程如下:


首先需要用DM提供的unique blank CRF做一下annotation。关于aCRF也有相应的指导原则可以参考:SDTM aCRF Guideline v1.0。

aCRF主要是依据SDTM IG来进行标注的,每张页面需要标注该页涉及到哪个域,收集的信息将被做进哪个变量。标注后大概类似下图。有了aCRF我们就可以根据aCRF、SDTM IG来写SDTM specs了。


SDTM specs大概类似这样,需要描述各个域的名称、标签、结构、关键变量、排序变量,需要所有变量的标签、类型、长度、来源、核心还有定义等等。这些大部分内容都可以在SDTM IG中找到(中文项目可以参考SDTM IG 3.2中文版)。

当我们被分配到一个domain,先去查找IG中相关章节,IG中的req,exp变量都是需要在spec中呈现的,req变量的要求是变量存在且任何记录都不能有缺值,exp变量的要求是尽量赋值,可以缺失,但该变量必须在SDTM datasets中,要不然P21也是会报warning的。所以我们写spec先把IG中req、exp的变量都放上,对于perm的变量如果有收集,就写进spec,如果未收集,就可以不做这个变量。然后对照aCRF将非SDTM的变量,放进SUPP--里。写Spec的时候也要注意check aCRF是否标注正确,再有经验的人也有犯错的机率。

写完了SDTM specs就可以按照SDTM specs愉快的开始编程啦!SDTM的编程工作相对来说是比较简单的,虽然太多复杂的衍生和计算,但是也会有一些tricky的处理,比如EPOCH的mapping,SV计划外访视的renumber,LB域LBTOX的衍生,如果coding是外部文件形式传输,和raw data mapping需要注意什么等等,后续会视情况出相关文章讨论以上问题哦,另外也欢迎大家私信我good questions!


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容