人工智能系统学习颅内出血的诊断、分类
能够根据CT扫描图像“解释”决策背后的原因
来自麻省总医院(MGH)放射科的一组研究人员开发了一个系统,利用人工智能快速诊断和分类脑出血,并从相对较小的图像数据集提供其决策的基础。这样的系统可以成为医院急诊科评估有可能危及生命的中风症状的病人的一个不可或缺的工具,从而使正确的治疗迅速得到应用。而不断增长的计算能力和大数据集的可用性提高了机器学习计算机分析数据的过程,识别模式和基本教自己如何执行一项任务没有直接参与人类的程序员——重要的障碍可以防止这样的系统集成到临床决策。这些问题包括对大型、标注良好的数据集的需求——之前开发的能够复制医生表现的成像分析系统,经过了超过10万张图像的培训——以及“黑匣子”问题,即系统无法解释它们是如何做出决定的。美国食品和药物管理局(fda)要求任何决策支持系统提供数据,允许用户审查其调查结果背后的原因。
“用‘小数据’或‘可解释的’来描述一项使用深度学习的研究有点自相矛盾,”该研究的两位主要作者之一、哈佛工程与应用科学学院(Harvard School of Engineering and Applied Sciences)研究生李贤光(Hyunkwang Lee)说。然而,在医学领域,收集高质量的大数据尤为困难。为了确保数据的一致性,让多个专家对数据集进行标记是至关重要的。这个过程非常昂贵和耗时。MGH放射学联合首席作者Sehyo Yune医学博士补充说:“一些批评者认为机器学习算法不能用于临床实践,因为这些算法不能为他们的决定提供理由。我们意识到,必须克服这两个挑战,以促进机器学习在卫生保健中的应用。机器学习在提高医疗质量和获得医疗服务方面具有巨大潜力。
为了训练他们的系统,MGH团队从904次头部CT扫描开始,每一次扫描大约包含40幅图像,由5名MGH神经放射学家组成的团队对这些图像进行标记,以确定它们是否描述了5种出血亚型中的一种,这取决于它们在大脑中的位置,还是没有出血。为了提高这个深度学习系统的准确性,由资深作者、医学成像与计算放射学实验室(MGH Radiology Laboratory of Medical Imaging and Computation)主任、哈佛大学医学院(Harvard Medical School)放射学助理教授多西奥(Synho Do)博士领导的研究团队模拟放射学家分析图像的方式,构建了一些步骤。其中包括调整对比度和亮度等因素,以揭示不立即明显的细微差别,以及滚动相邻的CT扫描切片,以确定出现在单个图像上的东西是反映了真实问题还是毫无意义的人为产物。
一旦创建模型系统,研究人员测试了它在两个不同的CT扫描,一组回顾性之前进行系统开发,包括扫描与100和100没有颅内出血,和一组潜在的79扫描和117没有出血,之后创建的模型。在回顾性分析中,模型系统在颅内出血的检测和分类方面与影像学家对扫描结果的评价一样准确。在对预期集的分析中,它甚至比非专业的人类读者更好。
为了解决“黑匣子”问题,团队对系统进行了检查,并从训练数据集中保存了最能清晰代表五种出血亚型经典特征的图像。利用该地图集的特点,系统能够显示一组图像类似的CT扫描分析,以解释其决定的基础。
“颅内出血的快速识别,导致对急性卒中症状患者的及时适当治疗,可以预防或减轻重大残疾或死亡,”合著者Michael Lev,医学博士,MGH放射学说。“许多医疗机构无法获得经过专门培训的神经放射学家的帮助——尤其是在夜间或周末——这可能需要非专家提供帮助,以确定出血是否是患者症状的原因。”神经放射学家培训的可靠的“虚拟第二意见”的可用性,可以使这些提供者更有效率、更有信心,帮助确保患者得到正确的治疗。
合著者Shahein Tajmir, MD, MGH放射学补充说,“除了提供非常需要的虚拟第二意见,这个系统还可以直接部署到扫描仪上,提醒护理团队出血的存在,并在患者离开扫描仪之前触发适当的进一步测试。”下一步是将该系统部署到临床领域,并在更多的病例中进一步验证其性能。我们目前正在建立一个平台,以便在该部内广泛应用这些工具。一旦我们在临床环境中运行,我们就可以评估它对周转时间、临床准确性和诊断时间的影响。