SDTM基础
观测数据和变量
- SDTM是围绕受试者在临床试验中收集的观测数据的概念所创建。
- 一系列变量(不同的列)组成观测,变量可以按照角色进行分类
- 标识符变量identifier
标识研究本身、受试者、域和记录序号;
- 主题变量topic
描述观测记录的主要目的
- 时间变量Time
描述观测记录的时间
- 修饰语变量qualifier
观测记录的更多特征,或者观测结果的进一步描述;可以进一步细分为5个子类别
- 分组修饰语(grouping qualifiers)
同一域数据分组信息
- 结果修饰语(result qualifiers)
发现类数据集中,描述与主题变量相关的特定结果,回答主题变量所要表达的问题;如ORRES、--STRESC 和 –STRESN;
- 同义词修饰语
其他可用名称;--TEST和--TESTCD、--LOINC
- 记录修饰语
一条记录的附加属性
- 变量修饰语(variable qualifiers)
对某一观测的特定变量进行修饰,结合被修饰变量才有意义。如ORRESU、--ORNRHI和--ORNRLO都是--ORRES的变量修饰语
- 规则变量Rule
在试验设计模型中,表达一种算法或可执行的方法,定义其开始或结束,分流或者循环
数据集和域
- 域(Domain) 是一组具有共同主题并且逻辑相关的观测结果的集合。其内在关系逻辑可能基于数据的科学属性或者与其在试验中的角色。
不恰当的说人话例子就是,域(domain)就是按照一套标准对于苹果的描述。
- 特点
- 每个域都由两个英文字母 组成的代码进行区别;
- 整个提交过程保持一致;
- 储存在SDTM标准变量DOMAIN中
- 应用
- 作为数据集名称
- 数据集中DOMAIN变量的值
- 数据集中大多数变量的前缀
- 关系型数据集中变量REDOMAIN的值
- 数据集(Data set) 每个域通过对应的数据集进行呈现。
不恰当的说人话例子就是,数据集就是呈现出的苹果实物。
- 特点
- 所有数据集二维结构,行观测,列变量
- 元数据对所属变量进行描述
- 储存在SDTM数据集中的既包括原始值和衍生值
- 元数据即 Define-XML,通常与研究数据一并向监管机构进行提交。
- Define-XML描述SDTM数据的一系列属性
- 变量名称(Variable Name):考虑到 SAS 传输格式兼容性,最多 8 个英文字符长度
- 变量标签(Variable Label):数据集中每个变量的标签应当是唯一的,且长度不超过 40 个英文字符
- 数据类型( Type):例如字符型或数值型
- 受控术语或数据显示格式:变量值通过术语或显示格式等进行呈现
- 来源(Origin):
- 角色(Role):决定了在相应数据集中如何使用该变量。对于 V3.X 域模型,角色用于表示变量的分类,如标识变量,主题变量,时间变量或五类修饰变量。
-
备注(Comments) 以及其它申办者用来与药物监管机构就该变量及其内容进
行交流的相关的必要信息。
不恰当说人话例子就是,你是一个人,叫什么(变量名称),小名别名(变量标签),男的女的(数据类型),什么型人格(受控术语或数据显示格式,已经规定好的类型),哪儿来的(来源),做什么的(角色),还有啥别的补充信息(备注)。
- 受控术语呈现方式
- 带星号(asterisk)的受控术语:表示当前无标准的受控术语可用,但是 SDS
团队期望申办者有自定义的受控术语或者 CDISC 受控术语团队可能会开发的
新的受控术语。- 受控术语清单:对外部没有维护,内部自己提供的受控术语,列出该变量的受
控术语清单。- 外部受控术语代码表:其名称可通过示例中的链接或者参考附录 C-受控术
语,进行获取。- 通用数据格式,如 ISO8601。 CDISC 受控术语团队将单独出版关于受控术语
使用的附加指南。
SDTM数据集分类
分类标准1 | 分类标准2 | 说明 |
---|---|---|
特殊目的数据集 | 域数据集 | 包括人口学信息(DM),备注(CO),受试者元素(SE)和受试者访视(SV);受试者级别的,不属于观测类数据集 |
特殊目的数据集 | 关联数据集 | RELREC和SUPP-- |
特殊目的数据集 | 试验设计模型(TDM)数据集 | TA和TE等包含试验设计的信息,不包含受试者数据 |
不恰当说人话例子就是,一群人要做一件事,域数据集包含的就是这群人的基本信息,TDM数据集包含的就是要做这件事的方法流程,所需要啥。
分类标准1 | 分类标准2 | 说明 |
---|---|---|
通用观测数据类别 | 干预类(Interventions) | 获取施加于受试者身上的干预措施(伴随有实际的或预期的生理效应) |
通用观测数据类别 | 事件类(Event) | 获取包括方案中计划的每一个重要里程碑事件 |
通用观测数据类别 | 发现类(Findings) | 获取临床计划中的评估类观测数据,通常包括用特定的检验指标或相关问题类条目 |
不恰当说人话例子就是,
一群人要做一件事,干预类包含的就是这群人吃了啥药或者比较特殊的东西没?抽烟喝酒烫头没?做没做啥手术?做这件事过程中这群人都要被咋对待;
事件类包含的就是这件事过程中发生在这群人身上值得被记录的事,比如啥时候来的,啥时候滚蛋的,做的过程中哪儿疼了痒了;
发现类包含的就是这件事过程中这群人身体相关指标数据。
SDTM标准域模型
特殊目的域 | 干预通用类观测数据类别 | 事件通用类观测数据类别 | 发现通用类观测数据类别 |
---|---|---|---|
备注 (CO) | 既往与合并用药 (CM) | 不良事件 (AE) | 药物收发记录 (DA) |
人口学 (DM) | 暴露采集 (EC) | 临床事件(CE) | 死亡详情 (DD) |
受试者元素 (SE) | 暴露 (EX) | 分布情况 (DS) | 心电图 (EG) |
受试者访视 (SV) | 嗜好品使用 (SU) | 方案偏离(DV) | 不满足的入选/排除标准 (IE) |
操作 (PR) | 就诊事件 (HO) | 实验室检查 (LB) | |
既往病史(MH) | 微生物检测 (MB) | ||
...... |
试验设计域 | 关联数据 |
---|---|
试验分组 (TA) | 补充修饰语数据集 (SUPP--数据集) |
试验疾病评估(TD) | 关联记录数据集 (RELREC) |
试验元素 (TE) | |
试验访视(TV) | |
试验入排标准(TI) | |
试验概要(TS) |
在决定变量应当被包含在哪一类具体域时,可参考以下的一般规则:
- 标识变量, STUDYID, USUBJID, DOMAIN,和–SEQ 在基于通用观测数据类别的所有域中是必须的。其它标识变量可根据需要添加。
- 除某些域特定限制外,相关时间变量可被允许使用在基于通用观测数据类别的域数据集中。
- 除某些域特定限制外,来自同一观测数据类别的任意修饰变量可以被添加到该域模型中。
- 申办者不可以在标准域中添加除了上述三点提到的任何别的变量。
- SDTM 允许申办者在 SUPPQUAL 补充数据集中包含非标准的 SDTM 变量
不恰当说人话例子就是,
比如做一道菜,麻婆豆腐。豆腐、辣椒之类的能看出是麻婆豆腐的食材肯定要有(STUDYID, USUBJID, DOMAIN,和–SEQ),其他菜谱上规定的食材按需添加;
除特殊情况,啥时间点加入啥菜,炒多久(相关时间变量);
除特殊情况,菜谱规定的可以加的一些小搭配(同一观测数据类别的任意修饰变量);
当然了,你想加不能加的,比如苹果(非标准的 SDTM变量),你可以按规定重新整个盘子装了端上桌。