240428 文献阅读-Transparent medical image AI via an image–text foundation model grounded in medical l...

Transparent Medical Image AI via MONET Model

[1] Kim C, Gadgil S U, DeGrave A J, et al. Transparent medical image AI via an image–text foundation model grounded in medical literature[J]. Nature Medicine, 2024, 30(4): 1154-1165.

Overview

The study introduces MONET (medical concept retriever), an image-text foundation model designed to enhance the transparency and trustworthiness of medical artificial intelligence (AI) systems. MONET connects medical images with text and provides dense scoring on concept presence, which is crucial for various tasks in medical AI development and deployment.

Key Features of MONET

  • Concept Annotation: MONET can annotate medical images with semantically meaningful concepts.
  • Training Data: Trained on 105,550 dermatological images paired with descriptions from medical literature.
  • Performance: Competes with supervised models built on clinically annotated datasets.
  • Use Cases: Enables AI transparency across the development pipeline, including data auditing, model auditing, and interpretation.

Dermatology as a Use Case

  • Dermatology was chosen due to the heterogeneity in diseases, skin tones, and imaging modalities.
  • MONET's annotation capability was verified by board-certified dermatologists.

Technical Approach

  • Contrastive Learning: Utilizes an AI technique to leverage natural language descriptions directly on images.
  • Encoder: Transforms images and text into a lower-dimensional vector space, forcing paired elements to be close and unpaired elements to be distant.

对比学习(Contrastive Learning)

目的:对比学习是一种人工智能技术,用于使模型能够直接利用图像上的自然语言描述。
方法:通过训练,使得同一图像-文本对在表示空间中彼此靠近,而不同对的表示则彼此远离。
模型架构:

  • 图像编码器(Image Encoder):使用视觉变换器架构(如ViT-L/14),将输入图像转换为一个固定维度的嵌入向量。
  • 文本编码器(Text Encoder):采用具有多层自注意力机制的变换器架构,将文本转换为相应的嵌入向量。

数据预处理

  • 图像:调整图像大小,进行中心裁剪和标准化处理,以符合编码器的输入要求。
  • 文本:使用小写字节对编码进行标记化,并对超长文本进行分割

训练过程

  • 损失函数:使用对称的交叉熵损失函数,基于余弦相似度评分。
  • 优化器:采用Adam优化器,并使用余弦学习率调度策略。
  • 超参数调整:通过将数据集分为训练集和验证集,选择最佳的批次大小和学习率。

自动概念注释

  • 原理:训练完成后,MONET能够测量图像与任意文本的接近程度,用于自动注释概念。
  • 方法:通过计算图像嵌入和概念提示嵌入之间的余弦相似度,得到概念存在分数。

数据审计

  • 概念差异分析:利用MONET将图像集映射到共同的嵌入空间,以自然语言描述图像集之间的不同特征。

模型审计

  • MA-MONET:通过聚类测试集图像,并比较低性能和高性能图像集之间的概念存在分数,以识别导致模型错误的医学概念。

构建固有可解释的神经网络(Concept Bottleneck Models, CBMs)
目的:创建一个可解释的模型,使医生或开发者能够理解影响模型决策的因素。
方法:利用MONET自动注释的概念来构建瓶颈层,然后在此层上训练一个简单的线性分类器。
评估设置

  • 预测目标:区分恶性和良性病变,以及黑色素瘤与其类似病变。
  • 图像类型:临床图像和皮肤镜图像。
  • 训练与测试:使用不同的训练-测试分割重复评估,以验证模型性能。

统计分析

  • AUROC值:通过不同的训练-测试集运行获得,并使用配对样本学生t检验来比较MONET与其他方法的性能。

临床试验评估

  • PROVE-AI研究:使用MONET对ADAE算法的临床试验进行复制和评估,分析与低特异性相关的概念。

数据和代码可用性

  • 数据集:使用的是公开可访问的数据集,如ISIC、Derm7pt、Fitzpatrick 17k和DDI。
  • 代码:分析中使用的代码可在GitHub上获得,包括数据收集、模型训练和基准研究的脚本。

Results

  • Automatic Concept Annotation: MONET successfully retrieves relevant clinical and dermoscopic images for various dermatological terms.
  • Performance Assessment: Compared favorably with supervised learning and CLIP models.
  • Diverse Skin Tones: MONET demonstrated consistent performance across different skin tones.
  • Nonclinical Concepts: Identified irrelevant artifacts that can affect AI predictions.

Data and Model Auditing

  • Data Auditing: MONET automatically examines datasets for irregularities, aiding in the auditing of large-scale datasets.
  • Model Auditing: A method called MA-MONET was developed to detect medical concepts leading to model errors.

Inherently Interpretable Models

  • MONET facilitates the creation of Concept Bottleneck Models (CBMs), which are inherently interpretable and allow physicians to understand factors influencing model decisions.

Real-world Application

  • MONET was applied to assess a clinical trial of a dermatology AI algorithm, providing insights into cases of lower specificity.

Limitations and Future Work

  • MONET may struggle with concepts not present in its training data.
  • Performance across skin tones for dermoscopic images was not examined due to dataset limitations.
  • MONET is not intended for diagnostic tasks and may exhibit biases present in the training data.

Conclusion

The MONET model presents a significant advancement in the transparency and interpretability of medical image AI, with potential applications in auditing, model development, and clinical deployment.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容