MIMIC-IV 被分成“模块”以反映数据的来源。目前有五个模块:
①core – 患者住院信息(即入院和转院)
②hosp – 患者的医院级数据:实验室、微型和电子药物管理
③icu -ICU 级别数据。这些是事件表,在结构上与 MIMIC-III(图表事件等)相同
④ed – 来自急诊科的数据
⑤cxr – 从 MIMIC-CXR 查找表和元数据,允许链接到 MIMIC-IV
⑥note – 去识别的自由文本临床笔记(未公开)
几个核心概念
1、患者标识符:患者包含每个唯一的信息subject_id。subject_id来自医院,是患者病历编号的匿名版本。admissions表包含每个唯一的信息hadm_id。hadm_id来自医院,是分配给每位住院患者的标识符的匿名版本。转移表包含每个唯一的信息transfer_id。transfer_id是一个人工生成的标识符,它被唯一地分配给单个患者的病房住宿。转移表还包含stay_id. 这是一个人工生成的标识符,它对合理连续的护理事件进行分组。
2、日期和时间:在数据库中存储日期和时间的列使用以下两个后缀之一存储:time或date. 如果一列具有time后缀,例如charttime,那么数据分辨率可以精确到分钟。如果该列具有date后缀,例如chartdate,则数据分辨率下降到当天。这意味着chartdate列中的测量值将始终具有 00:00:00 具有小时、分钟和秒值。这并不意味着它是在午夜记录的:它表明我们没有确切的时间,只有日期。
3、日期转换:数据库中的所有日期都已更改,以保护患者的隐私。同一患者的日期将在内部保持一致,但在未来随机分布。发生在当前时间的出生日期不是真实的出生日期。此外,如果患者年龄超过 89 岁,则出现在 1900 年之前的出生日期。在这些情况下,患者首次入院时的年龄已固定为 300 岁。
charttime对比storetime:大多数数据,除了与患者相关的人口统计数据外,都记录了表明观察时间的时间:charttime。charttime可以追溯到纸质图表的使用:为了方便护理人员进行有效观察,将一天分成小时块,并在这些小时块内记录观察结果。因此,任何时候在 04:00 和 05:00 之间进行测量时,数据都会在 04:00 块中绘制,依此类推。这一概念已经延续到数据的电子记录中:即使数据是在 04:23 记录的,在许多情况下,它仍然被记录为在 04:00 发生。
storetime提供有关数据元素本身记录的信息。数据库中的所有观察结果在归档到患者病历之前都必须经过验证。storetime提供此验证发生的确切时间。例如,可以在 04:00 绘制心率图表,但仅在 04:40 进行验证。这表明护理人员在 4:40 验证了测量结果,并表明这是在 04:00 对患者的有效观察。相反,也有可能storetime发生在charttime. 虽然格拉斯哥昏迷量表可能绘制在charttime04:00,观察可能在稍早之前进行并验证(例如 3:50)。同样,验证意味着护理人员认为测量结果准确反映了患者在特定情况下的状态charttime。
①charttime是绘制测量图表的时间。在几乎所有情况下,这是与实际测量时间最匹配的时间。在连续生命体征(心率、呼吸频率、有创血压、无创血压、氧饱和度)的情况下,charttime通常正好是测量时间。
②storetime是数据记录在数据库中的时间:从逻辑上讲,它发生在 之后charttime,通常是几小时,但通常不会超过这个时间。
4、其他时间:chartdate等价于charttime,除了它不包含任何时间信息(对于这些测量,所有小时、分钟和秒均为 0);admittime分别dischtime是入院和出院时间。deathtime是患者在医院死亡时的死亡时间。如果患者在给定住院期间没有在医院内死亡,deathtime则无效。intime并outtime提供患者进入和离开给定单元的时间。在icusstays表中,单位始终是 ICU。在转诊表中,单位可以是医院的任何病房。对于在一段时间内发生的事件,starttime并endtime提供事件的开始和结束时间。对于医疗输液,这些列表示物质被施用的时期。dod是来自医院数据库的患者死亡日期。transfertime是患者服务发生变化的时间。