1. Fundamentals of the SDTM
1.1 observations and variables
1. Identifier variables: 标识符变量。(识别study, subject, domain, sequence number (e.g. ae aeseq))
2. Topic variabes: 主题变量。(说明这个实验的重点(e.g. the name of a lab test))
3.Timing variables: 时间变量。(e.g. start date and end date)
4. Qualifier variables: 限定性变量。
4.1 Grouping qualifiers 分组限定词 —CAT —SCAT
4.2 Result Qualifiers 结果限定词
4.3 Synonym Qualifiers 同义词限定词 —DECOD (—TRT、—TERM 主题变量的等同术语)
4.4 Record Qualifiers 记录限定词 整个观察记录的额外属性(而不是描述记录中的某个特定变量)。例如:AE领域的--REASND、AESLIFE和所有其他严重不良事件(SAE)标志变量;DM领域的AGE、SEX和RACE;以及--BLFL、--POS、--LOC、--SPL等。
4.5 Variable Qualifiers 变量限定符用于进一步修改或描述观察中的特定变量,只有在其限定的变量范围内才有意义。例子包括 --ORRESU, --ORNRHI, 和 --ORNRLO, 它们都是 --ORRES 的变量限定符;以及 --DOSU, 它是 --DOSE 的一个变量限定符。
1.2 The General Observation Classes
1. The Intervensions class 干预类包括研究性的、治疗性的和其他的治疗,这些治疗是根据研究方案的规定对受试者进行的(有一些实际的或预期的生理效果)。观察对象(具有一些实际或预期的生理效果),无论是研究方案规定的 (例如,接触研究药物),与研究评估期同时进行(例如,伴随药物)或由受试者自我管理(例如,使用酒精、烟草或咖啡因)。
2. The Evnents class 事件类记录了计划中的里程碑,如随机化和研究完成,以及 试验期间发生的独立于计划研究评估的事件、条件或事故 (如:不良事件 adverse events)或试验前(prior to the trial)(如:病史 medical history)。
3. The Findings class 研究结果类记录了计划中的评估所产生的观察结果,以解决具体的测试或 问题(如实验室测试、心电图测试(ECG testing)、问卷调查中列出的问题)。
1.3 Datasets Other than General Observation Class Domains
除基于一般观测类的数据集外,SDTM还包括4种类型的数据集。
- 领域数据集,其主体层面的数据不符合3个一般观察类别中的一个。这些数据集包括人口统计学(DM)、评论(CO)、主题元素(SE)和主题访问(SV)。
- 试验设计模型(TDM)数据集,代表研究设计的信息,但不包含受试者数据。这些数据集包括诸如试验工具(TA)和试验要素(TE)等
- 关系数据集,如RELREC和SUPP--数据集。
- 研究参考数据集包括设备识别码(DI)和非宿主生物体识别码(OI)。这些数据集提供了代表受试者数据中使用的研究特定术语的结构。
1.4 The SDTM Standard Domain Models
这些一般规则适用于确定在域中包含哪些变量。
- 标识符变量、STUDYID、USUBJID、DOMAIN和-SEQ在所有基于一般的观察类别。其他标识符可以根据需要添加。
- 任何时间变量都可以在任何基于一般观察类的提交数据集中使用,除非受到特定领域假设的限制。
-Any additional Qualifier variables 都可以用于基于一般观测类别的任何提交的数据集,但受特定领域假设的限制除外。
- 除了前面3条所述的变量外,申办者不得添加任何其他变量。SDTM允许使用 "补充限定符"(Supplemental Qualifiers)的特殊目的数据集结构将申办者的非 SDTM 变量纳入其中数随着 SDTM 的不断发展,某些额外的标准变量可能会被添加到general observation classes。
- 在此过程中,不能为新的用途而对标准变量进行重新命名或修改。在此基础上,我们还将继续努力。
- 在 SDTM 数据集中,应酌情使用 "允许变量(Permissible variable)"。如果一项研究包括一个可以用允许变量表示的数据项目,那么该变量必须包括在SDTM数据集中,即使是空的。请参考Define-XML标准(可在https://www.cdisc.org/standards/data-exchange/define-xml),以了解关于如何管理无数据可用性( no data availability)的其他细节。
- 如果某项研究不包括在允许变量中表示的数据项目,则该变量不应包括在SDTM数据集中,也不应在Define-XML文件中声明。
1.5 Creating a New Domain
本节介绍了创建自定义域的总体过程,它必须基于3个SDTM中的一个一般观察类(General observations)中的一个。提交的域的数量应基于研究的具体要求。
1. 确认现有公布的域中没有一个能满足需要。只有当数据的性质不同,且不适合于现有公布的域时,才可以创建自定义域。
o 建立一个共同主题的域;也就是说,数据的性质是相同的,而不是通过特定的收集方法(例如,心电图)。在域内使用--CAT、--SCAT、--METHOD、--SPEC、--LOC等,酌情对数据进行分组和分离。不同主题的例子有:微生物学、肿瘤测量、病理学/组织学、生命体征和体检结果。
o 不要根据时间建立单独的领域;而是在一个领域中同时代表以前和现在的观察结果(例如,所有非研究性药物的CM)。注意不良事件(AE)和病史(MH)是这个最佳实践的例外,因为监管报告的需要。
o 如何使用所收集的数据(例如,支持分析和/或疗效终点),不得导致创建一个自定义域。例如,如果血压测量值是高血压研究的终点,它们必须在生命体征(VS)域中表示,而不是一个自定义的 "疗效 "域。同样地,如果肝功能测试结果是特别重要的,它们仍然必须体现在实验室测试(LB)域中。
o 在单独的CRF模块或页面上收集的数据可能适合于现有的领域(例如,作为单独的问卷调查进入QS)。
o 在不同的CRF模块或页面上收集的数据可能适合于现有的领域(例如,作为单独的问卷调查进入QS领域,在CM领域中的既往和伴随用药 (prior and concomitant medications))。
o 如果有必要表示具有层次性的数据之间的关系(例如,必须先观察父母记录,再观察子女记录),则建立一个域对(例如,MB/MS,PC/PP)。注:已经为微生物学数据(MB/MS域)和药物动力学(PK)数据(PC/PP域)建立了域对(domian pair)模型,以便使用RELREC描述数据集级关系。域对使用DOMAIN作为标识符,将父记录(如MB)与子记录(如MS)分组,并使数据集级关系能够在RELREC中描述。如果不使用DOMAIN来促进数据关系的描述,目前定义的RELREC 如果不引入一个像DOMAIN那样的数据分组变量,就无法使用目前定义的RELREC。