SDTM domain和dataset的区别

SDTM Implementation Guide里面会反复出现domain(域)和dataset(数据集)这两个术语,今天我们来看下这两个术语的区别。

Domain(域)是指⼀个逻辑相关并且具有共同特定主题的数据的集合。数据通常是指收集了⼀个临床试验中所有受试者的数据。

Dataset(数据集)是指⼀个集合了结构化的数据的单⼀⽂件。

简⽽⾔之,域是⼀组相关的数据组,⽽数据集是指与该组数据相关联的数据结构。域和数据集都使⽤相同的命名法,这就是它们经常混淆的原因。

什么情况下会需要区分这两种术语呢?当需要做拆分动作的时候:

    LB domain太⼤

    QS domain按照问卷类型进⾏拆分

    FA domain按照parent domain(⽗域)进⾏拆分

然⽽,由于在⼤多数情况下,域和基于该域的数据集之间存在⼀对⼀的关系,并且它们的命名规则相同,因此在许多情况下它们是可以互换使⽤的。

注意在关联数据集(RELREC, SUPP--)中,没有DOMAIN这个变量,取⽽代之的是RDOMAIN变量,它是⽤来记录关联域信息的。

在RELREC⾥,如果要体现⼀个拆分的Findings About domain,

则RDOMAIN放的是4个字符的数据集名称,如下:


拆分数据集的SUPP--数据集(⽐如FACM的SUPP--数据集SUPPFACM)中的

RDOMAIN值为2个字符的domain名字,比如SUPPFACM.RDOMAIN='FA'。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容