在SDTM标准下,每一个域,都可能有几十个变量。不同域中,也有很多变量具有相类似的特征。比如LBTEST, VSTEST, PETEST,都是表示检测项目,只不过分别使用于实验室检测、生命体征、体格检查中。
现在,以LB(实验室检测)为例,盘点一下SDTM中各种类型的变量。
1. 标识变量
用于识别项目、受试者、记录等等。
比如在LB中,STUDYID表示研究识别号,USUBJID表示受试者识别号,LBSEQ表示受试者的记录的唯一识别号,都用于识别某个项目、某个受试者、某些特定记录,都属于标识变量。
2. 主题变量
用于表示观测聚焦的主题。主题变量数量上最少,因为一个域,只有一个主题。在干预类中,是干预的名称;在事件类中,是事件的名称;在发现类中,是检查或问卷的名称。
LBTESTCD表示实验室检测的名称的代码,是主题变量。
3. 时间变量
用于表示观测的时间。时间变量,不仅包括绝对时间,年月日时分秒(LBDTC),也包括相对时间变量,比如相对首次用药的天数(LBDY)、访视(VISIT, VISITNUM)、Epoch等等。
4. 修饰变量
用于提供观测的额外的特征、说明等信息。这一个类别的变量,数量最多。根据所修饰的内容的不同,可以再分为5个小类。
(1) 分组修饰。
LBCAT表示实验室检测的分组,是分组修饰。
(2)结果修饰。
LBORRES表示实验室检测的原始结果,是结果修饰。
(3)同义词修饰。
LBTESTCD表示实验室检测项目名称的代码,而LBTEST表示检测项目名称。LBTEST则是同义词修饰。
(4)记录修饰。
LBSTAT表示检测有没有做,LBREASND表示检测未做的原因,都是对整个记录的修饰,而非对单一变量的修饰,所以都是记录修饰。
(5)变量修饰。
LBORRESU表示实验室检测原始结果的单位,修饰变量LBORRES,而非修饰整个记录,所以LBORRESU是变量修饰。类似的变量包括原始结果的下限(LBORNRLO)和上限(LBORNRHI)
6. 规则变量。
仅使用于试验设计的域中。
当然,我觉得,记住每个变量是什么角色,可能也没有那么必要,在词典中都能查到。
只要了解SDTM中的变量都有哪些角色,对数据类型有一定的了解。当我们对原始数据标准化的时候,就更有把握原始数据对应SDTM中那一个变量了。
本文章首发于公众号【SAS编程未来】。