2. Submitting Data in Standard Format
2.1 Primary Keys
因为Primary Keys的目的是帮助评审员理解数据集的结构,所以申办者应该列出数据集的所有自然键值。这些键应该定义数据集内记录的唯一性,并可以定义记录的排序顺序。每个数据集的标识键数据集的键应该与Define-XML文件中对数据集结构的描述相一致。
对于所有的一般观察类领域(以及一些特殊目的领域),创建--SEQ变量的目的是为了通过它的使用,在所有这些领域中都能一致地识别出一条唯一的记录,同时还有STUDYID、USUBJID和DOMAIN。在大多数领域中,--SEQ将是构成自然键的一组变量的代用键。在某些情况下,补充限定符(SUPP-)变量也可能有助于
Definitions
A natural key is a set of data (1 or more columns of an entity) that uniquely identifies that entity and distinguishes it from any other row in the table.
natural key的优点是它们已经存在;我们不需要在数据模式中引入一个新的、"不自然的 "值。选择自然键的困难之一就是我们所能想到的任何自然键都有可能发生变化。因为它们具有业务意义,所以自然键与业务有效地耦合在一起,当业务需求改变时,它们可能需要被重新加工。在临床试验数据中,这种变化的一个例子, 在一项新的研究中,增加一个位置或地点,成为一个key,但在以前的研究中没有收集。
A surrogate key is a single-part, artificially established identifier for a record.
surrogate key的分配是衍生数据的一个特殊情况。其中primary key的一部分是衍生的。代用钥匙对业务需求的变化是免疫的。此外,该键只依赖于1个字段,所以它很紧凑。推导代用键值的一个常见方法是按顺序分配整数值。SDTM数据集中的--SEQ变量是大多数数据集的代用钥匙的例子;然而,在某些情况下,--SEQ可能是自然钥匙的一部分,作为主办方数据库中可能是钥匙(如重复序列号)的替代。
2.2 Assumptions for Domain Models
2.2.1 EPOCH Variable Guidance
当EPOCH被包含在研究结果类域(Findings class domain)中时,它应该基于-DTC变量,因为这是测试的日期/时间,或者,对于在标本上进行的测试,是标本采集的日期/时间。对于干预或事件类领域(Interventions or Events class domains)的观察,EPOCH应该基于-STDTC变量,因为这是干预或事件的开始时间。一个可能的(尽管不太可能)例外情况是,基于在一个纪元开始但在另一个纪元结束的间隔性标本采集的发现。在这种情况下,"ENDTC "可能是EPOCH的更合适的依据,但在可能的情况下,应根据CRF的说明和结构指定EPOCH值。
即使EPOCH没有被直接收集,日期/时间数据的收集也不够精确,不能仅根据日期/时间数据将观察值分配给EPOCH。如果不可能确定观测的历时,那么EPOCH应该是空的。分配 EPOCH 值的方法可以在 Define-XML 文件中描述。
由于EPOCH是一个研究设计结构,它不适用于受试者参与研究之前开始的干预或事件,也不适用于参与研究之前的发现。对于此类记录EPOCH应该为空。请注意,受试者参与研究包括筛查,这通常发生在 在人口统计学(DM)领域的参考开始日期(RFSTDTC)之前。
2.2.2 SDTM Core Designations
- 必需变量(Required variable)是指任何对于识别数据记录来说是基本的变量(即基本的关键变量(essentical key variable)和主题变量(topic variable)),或者是使记录有意义的必要变量。必需变量必须始终包含在数据集中,并且任何记录都不能为空。
- 预期变量(expected variable)是使记录在特定领域背景下有用的任何必要变量。预期变量可能包含一些空值,但在大多数情况下,每条记录都不会包含空值。然而,当研究不包括预期变量的数据项时,数据集中仍然必须包括一个空列,并且必须在Define-XML文档中加入一个注释,说明研究不包括该数据项。
- 在SDTM数据集中应酌情使用 "允许变量(Permissible variable)"。尽管领域规范表只列出了SDTM中列出的一些标识符、时间和一般观察类变量,但所有这些都是允许的。除非在本实施指南中特别限制(见第 2.7 节,SDTMIG 中不允许的 SDTM 变量)或由特定的领域假设来限制。