SDTM Implementation Guide里面会反复出现domain(域)和dataset(数据集)这两个术语,今天我们来看下这两个术语的区别。
Domain(域)是指⼀个逻辑相关并且具有共同特定主题的数据的集合。数据通常是指收集了⼀个临床试验中所有受试者的数据。
Dataset(数据集)是指⼀个集合了结构化的数据的单⼀⽂件。
简⽽⾔之,域是⼀组相关的数据组,⽽数据集是指与该组数据相关联的数据结构。域和数据集都使⽤相同的命名法,这就是它们经常混淆的原因。
什么情况下会需要区分这两种术语呢?当需要做拆分动作的时候:
LB domain太⼤
QS domain按照问卷类型进⾏拆分
FA domain按照parent domain(⽗域)进⾏拆分
然⽽,由于在⼤多数情况下,域和基于该域的数据集之间存在⼀对⼀的关系,并且它们的命名规则相同,因此在许多情况下它们是可以互换使⽤的。
注意在关联数据集(RELREC, SUPP--)中,没有DOMAIN这个变量,取⽽代之的是RDOMAIN变量,它是⽤来记录关联域信息的。
在RELREC⾥,如果要体现⼀个拆分的Findings About domain,
则RDOMAIN放的是4个字符的数据集名称,如下:
拆分数据集的SUPP--数据集(⽐如FACM的SUPP--数据集SUPPFACM)中的
RDOMAIN值为2个字符的domain名字,比如SUPPFACM.RDOMAIN='FA'。