工信部一月份印发《大数据产业发展规划(2016-2020年)》大数据相关产品和服务业务收入突破1万亿元,年均复合增长率保持30%左右。广东省近日也提出《关于促进和规范健康医疗大数据应用发展的实施意见》。医疗大数据在近一年的发展之后,发展情况如何?应该如何落地?
医疗数据的收集方式日渐成熟。虽然互联网平台可以收集患者健康检索数据,咨询数据和购药数据,但是医疗数据的主要战场还是医院。医院里的HIS系统,CIS系统积累的大量的患者病例信息。目前第三方平台从医院里获取数据的手段有两种。
偏向于数据抽取方式的,以医度云为代表。例如与北京大学人民医院合作,通过接口,与医院HIS系统对接。抽取出来的数据,利用语义识别技术,将非结构化的数据转变成结构化的数据。语义识别的技术,目前经过优化,识别率已经比较高,能够代替人工使用。里面的工作主要是编写规则,建训练集。
第二种方式,是人工录入辅以机器识别,例如思派科技。人工录入的好处也是显而易见的,能够与医生进行深度沟通和反馈,灵活性好。还可以根据具体情况,对机器进行校验。另外医院的数据有可能分布在多个地方,需要人工查找,补充出来的数据会更全。
通过这两种方式积累了大量的医疗数据,问题也随之来了,接下来怎么做?
医疗大数据是基础设施,随后的是价值回归。
医疗大数据的首要价值是医院和医生的需求,这是当初的承诺。是否有帮助医院降低住院率,是否有帮助医生提高科研的效率,可以是硬性的衡量指标。allina health是美国双子城最大的医疗集团,通过医疗数据的积累,能够识别再住院风险高的患者,并为高风险的患者提供进一步的支持,从而降低了住院率到15%,产生良好效果。北京大学人民医院通过医疗大数据技术,建立临床数据中心,运营管理系统,影像数据中心三大系统,加快科研进程。采用随机森林算法,建立心衰患者出院1年后再入院的发生率预测模型。在这个项目中,纳入1.5万名心衰患者仅需要1周时间,如果使用传统方法,需要2年时间。
医疗大数据更大的价值是在制药企业。诺华公司借助借助精准医疗数据和技术平台cota,对肺癌患者进行了一项研究,比较了EGFR / ALK突变基因检测对患者平均存活率的影响,借予指导公司市场决策。
在接下来的一段时间里,基于辅助决策的案例将日益增加,这块沃森已经走在前列,国内的成果还很多停留在帮助医生发论文的阶段,但是随着商业公司的逐步发展,也必将把各种模型完善到自己的云端系统里。
欢迎加入私人微信号(ID: pharmacy)交流。