建立全局患者主索引的核心,是对多条患者信息进行对比,判断是否属于同一个实体患者,因此需要一种准确而有效的患者匹配规则。
常见的匹配规则有两种,一种是完全匹配,一种是模糊匹配。
所谓完全匹配,是指对患者信息的关键项进行对比,完全一致,则认为是同一患者,自动合并;不一致,则认为是不同患者,不合并。模糊匹配,则是选取患者信息的关键项进行相似度计算,并配置相似度区间的范围,以对应自动合并、人工合并和不合并三种处理流程。
这里所说的患者信息,主要可分为以下三类:
使用生物识别信息进行匹配,是最为准确的,但是现有系统中,此类信息相对应用较少,而不同系统中的患者信息质量参差不齐,因此实际使用过程中,主要根据不同系统的数据特点,从标识信息和属性信息中选取不同的组合,作为关键项进行匹配。
采用完全匹配的好处是,能尽可能的保证匹配的准确性,适合于对主索引的准确度要求高但数据量相对不那么高的场景。模糊匹配的特点是可以依据统计概率来计算两条记录之间相似度,适合于重复数据量大、对匹配结果精度要求不那么高的场景。
匹配规则是一个患者主索引系统的核心,为了满足不同使用场景的需求,通常会做成灵活可配的,各个医疗机构可以根据自身的数据特点以及业务特点来设置。