Nat Med | 癌症组织病理学中分散式人工智能的群体学习
原创 图灵基因 图灵基因 2022-06-02 07:03 发表于江苏
收录于合集#前沿生物大数据分析
包括利兹大学医学科学家在内的一个国际研究团队表示,他们已经开发出一种新方法,利用人工智能从患者数据中预测癌症,而不会将个人信息置于风险之中。科学家们在《Nature Medicine》上发表了他们的研究成果(“Swarm learning for decentralized artificial intelligence in cancer histopathology”)。
“人工智能(AI)可以直接从常规组织病理切片预测分子改变的存在。然而,训练强大的AI系统需要大型数据集,数据收集面临着现实、道德和法律方面的障碍。这些障碍可以通过群体学习(SL)来克服。合作伙伴可以共同训练人工智能模型,同时避免数据传输和垄断数据治理。”研究人员写道。
“在这里,我们展示了SL在来自5000多名患者的千兆像素组织病理学图像的大型多中心数据集中的成功应用。我们表明,使用SL训练的AI模型可以直接从苏木精和伊红(H&E) 染色的结直肠癌病理切片预测BRAF突变状态和序列不稳定性。我们在来自北爱尔兰、德国和美国的三个患者队列上训练了AI模型,并在来自英国的两个独立数据集中验证了预测性能。”
“我们的数据显示,经过SL训练的AI模型优于大多数局部训练的模型,并且性能与在合并数据集上训练的模型相当。此外,我们还表明,基于SL的AI模型数据效率较高。未来,SL可用于为任何组织病理学图像分析任务训练分布式AI模型,无需数据传输。”
研究人员开始探索一种称为群体学习的人工智能是否可以在不从医院发布数据的情况下,帮助计算机在患者组织样本的医学图像中预测癌症。群体学习训练人工智能算法来检测当地医院或大学的数据模式,例如人体组织图像中的基因变化。
然后,swarm学习系统将这种新训练的算法(但没有本地数据或患者信息)发送到中央计算机。在那里,它以相同的方式与其他医院生成的算法相结合,以创建一个优化的算法。然后将其发送回当地医院,在那里将其重新应用于原始数据,由于其更灵敏的检测能力,改进了对基因变化的检测。
通过多次执行此操作,可以改进算法,并创建一个适用于所有数据集的算法。这意味着该技术可以应用,而无需向第三方公司发布任何数据,也无需在医院之间或跨境发送任何数据。
该团队根据来自北爱尔兰、德国和美国的三组患者的研究数据对AI算法进行了训练。这些算法在利兹大学生成的两组大型数据图像上进行了测试,发现它们成功地学会了如何预测图像中不同癌症亚型的存在。
“基于来自5000多名患者的数据,我们能够证明,经过群体学习训练的AI模型可以直接从结肠肿瘤组织的图像中预测与临床相关的基因变化。”利兹大学医学院客座副教授、亚琛工业大学附属医院研究员Jakob Nikolas Kather说。
利兹大学医学院病理学教授Phil Quirke博士补充说:“我们已经证明,群体学习可以用于医学,为任何图像分析任务训练独立的AI算法。这意味着有可能克服数据传输的需要,而无需机构放弃对其数据的安全控制。创建一个能够执行此任务的人工智能系统可以提高我们在未来应用人工智能的能力。”