SDTM_Define的前期准备文件:MappingSpec,aCRF , SDTM数据集文件
1、MappingSpec
- 变量Origion(CRF、eDT、Derived、Assigned、Protocol)含义
- CRF: Data, whether preprinted or not, collected as a part of a CRF with an associated annotated CRF.
- eDT: Data received via an Electronic Data Transfer (eDT), usually without associated annotations. (eg, data streams such as labs, ECG, or IRT)
- Derived: Data not directly collected but calculated by an algorithm or reproducible rule which is dependent upon other data values.
- Assigned: A value determined by individual judgment rather than collected or derived. (eg, values for DOMAIN, coded terms supplied by coding process). For example all Dictionary Coded Variables should have an Origin of Assigned.
- Protocol: A value defined as a part of Trial Design preparation. (eg, VSPOS, which may be specified only in the protocol and not appear on CRF)
简单翻译下:
- CRF:无论是否预印,作为带有注释的CRF的一部分,收集的数据。
- eDT:通过电子数据转换接受的数据;通常不会有对应的注解(例如,labs、ECG或IRT等数据流)
- Derived:不是直接收集,而是通过算法或生成规则计算得出的数据;独立于其他数据值。
- Assigned:通过独立判断产生的变量值,举例来讲所有的字典编码的变量的来源都应该以Assigned。
- Protocol:作为试验数据准备的一部分,定义的值。
这里比较容易引起误区的是,直接引用一个变量值,是Assigned 还是Derived,这里确定下是Derived。
- MappingSpec中可能没有TrialDesign的数据集的信息,这一部分的内容需要自己添加。
2、Origin确定后有一些注意点:
- 当Origin为CRF时,这里需要确认CRF的PDF中这个文件已经注释过了;否则Run程序时会出现高亮提醒,变量在CRF中的变量缺失;遇到缺失情况,需要重新修改aCRF原文件。
- 当Origin为Derived时,这里DDT Comment列必须有值,也就是变量值生成的逻辑,尽量用书面语言描述;一般从Spec中导入的Comment过于代码化,这一块需要花大量时间修改和Review。#
- eDT、Protocol、Assigned相对简单,前两者Comment列可以为空;Assigned直接是Set to 'XXXX'。
- 有一些变量看起来是Drived,但是CRF直接可以对应到这个变量,设置为CRF。
3、关于aCRF的处理
CRF(Case Report Form),病例报告表,是为了收集受试者的各项数据信息;aCRF(Annotated CRF),注释过的CRF,相比于原始版本的CRF的PDF文件,aCRF多了注释信息,Origin为CRF的变量信息必须在CRF中已经注释好。
关于注释信息的导出。使用的软件是的Adobe Acrobat Reader DC_18.11.20036.265267,不同的版本,操作界面会有不同;具体的流程:View--Tools--Comments--Options--Export all to data--选择xfdf格式
aCRF中注释举例
- FA=Findings About Events or Interventions, Domain解释在页眉处写好;
- FACAT = UC History and Disease Status,CAT变量通常与datapageneme 对应;
- FATEST=Date of Symptom Onset, FAORRES where FATESTCD= UCONSET, XXTEST, XXORRES,这两个变量对应同一个位置
- MappingSpec中的Flag为 S的变量,的注释为:SUPPCM.QVAL where QNAM=ASAYN;这类信息是保存在SUPP数据集中。
4、生成AdeptSpec时的诊断流程
- 程序进行过程中的错误会被用高亮的方式进先标出,如果是缺失的信息,直接在AdepSpec中直接补充。
- 若是逻辑错误,这时候首先查MappingSpec确定变量的来源用途,然后通过查看数据集中的具体数据,进行确定;若还是无法确定,继续查看General.SAS、具体Domain代码,通过代码逻辑进行推断。