梳理完主索引的主要流程,遇到了一个出其不意的问题。多中心场景下,该由谁来确定匹配规则?
问题来源于一个实际的集团化医院建设场景,参与多中心建设的医院要求各医院必须能自己配置自己的主索引匹配规则,核心诉求是确保区域主索引的正确性。简单来说,就是医院内容经过自己的主索引系统关联后,认为给区域贡献了100位患者的信息,进入多中心的主索引系统后,仍然是这100位患者,只是基于区域主索引系统,实现这100位患者的与其他医院相应就诊信息的关联。
可以说,这个需求与最开始我们设计患者主索引系统时的理念是有冲突的。如果某家医院的数据质量不够好,他们仅基于院内数据和匹配规则计算后的患者,极有可能是有一定重复的,还强行要求这些重复的患者不能进行合并,似乎与EMPI的理念相悖。
但是买单方永远有最大的话语权,为了满足不同场景的需求,我们只好设计了两层规则管理机制,区域中心的匹配规则和各机构的匹配规则。每条患者数据先匹配自己医院的规则,若未命中,再执行区域中心的匹配规则。
在本次集团化医院的场景下,各家医院配置自己的规则而区域中心不配置规则即可。即可满足系统执行一套匹配规则的要求,也可满足执行多套匹配规则的要求。
当然,我隐约觉得这各医院自己配置规则是个伪需求,依然达不到他们的初衷,简单的反例如下:
前提:统一主索引系统,接入医疗机构A,医疗机构B
第一种情况:各机构独立设置匹配规则,且本机构数据仅执行本机构匹配规则
A机构匹配规则:身份证号一致
B机构匹配规则:姓名+性别+出生日期一致
表现:在多机构主索引中,认为A机构的AP1和AP2为同一患者
第二种情况:多中心统一设置匹配规则,管理员排优先顺序
优先级1:身份证号一致;
优先级2:姓名+性别+出生日期一致。
表现:在多机构主索引中,认为A机构的AP1和AP2为同一患者
结论:在本例中,医疗机构A和B无论是否单独设置匹配规则,都会得出统一结论,无法确保A医院的2个患者在经过多中心EMPI系统后,仍然是2个患者。
但是作为一个小白,当然无法扭过数据行业大拿们的大腿,就这样吧。