肺癌是全世界癌症相关发病率和死亡率的主要原因之一,每年估计有180万人死亡。肺外科手术尤其是肺段切除术一直是肺癌患者的主要治疗方法,在不影响肺动静脉的前提下,准确切除受影响的肺部分是治疗肺癌的关键。否则,在肺手术过程中,如果对患者的解剖结构不了解,可能会发生出血和增加手术切除。近年来,包括虚拟现实(VR)和3D打印在内的3D可视化已被用于肺癌手术计划,外科医生可以获得对解剖结构的生动了解。然而,在目前的临床实践中,肺动脉和肺静脉是手工分割的,耗时长,成本高,而且缺乏可重复性。数据集包括从西门子的SOMATOM Definition Flash机器获得的95个3D CT扫描。患者年龄29 ~ 82岁,平均58.4岁。图像大小为512× 512×(280−370)体素,典型体素大小为0.25×0.25×0.5mm3。注释包括肺内和肺外动脉和静脉。所有的注释都是由肺癌专家外科医生完成的,每张图像花费2-3.5小时。值得注意的是,数据集中的所有患者都进行了肺癌手术,这些注释已被有效地用于临床实践,以支持外科医生计划此类手术。为提高标记效率,仅标记左肺或右肺有淋巴结的血管。因此,大多数图像只有一半的肺有注释,而少数图像两个部分都有标签。将数据集分为两个子集,每个子集代表一半的肺,并且只使用带有注释的子集进行训练和测试。最终的数据集由106个受试者组成。此外,还为两个肺区域目的标记。一方面,这有助于区分肺内外的肺动脉和静脉。
数据下载:
https://www.kaggle.com/datasets/xiaoweixumedicalai/mytest/data?select=lung_vessel
二、MedArabiQ2025数据集 大型语言模型 (LLM) 在医疗保健应用中显示出非凡的前景,但由于缺乏高质量的特定领域数据集,它们在阿拉伯医学领域的性能在很大程度上仍未得到探索。MedArabiQ 引入了一个新的基准数据集,该数据集由七个阿拉伯语医学任务组成,涵盖多个专业和问题格式:多项选择题,填空题(有和没有选项),医患问答。该数据集是使用过去的体检和公开可用的资源构建的,并进行了修改以评估 LLM 的各种能力,包括减少偏见。MedArabiQ 基准测试由以下 7 个数据集组成:1、多项选择 – 医学知识评估,2、多项选择 – 医学环境中的偏倚评估,3、填空 (含选项),4、 填空 (无选择),5、 医患问答 (QA),6、使用 GEC 进行 QA,7、LLM 修改的 QA。每个数据集都采用 CSV 格式,包括任务描述、输入提示和真实答案。 300 个带注释的问题组成的训练集来开发和评估模型,对于评估阶段,将发布一个包含 100 个问题的单独测试集。 数据下载:https://www.codabench.org/competitions/8967/
三、FLARE2025数据集 在 FLARE 2025 中,目标是通过将挑战扩展到六项任务来进一步促进泛癌种分割和在低资源设置(例如,没有可用的 GPU)上的模型部署的发展:泛癌种分割、轻量级分割、域适应、CT和MRI基础模型,多模态模型,医疗智能体。过去的FLARE 挑战证明了在分割准确性和效率之间实现良好权衡的可能性。例如,在 FLARE 2022 挑战赛中,获胜的解决方案可以在不到 10 秒的时间内准确分割包含超过 1,000,000 个体素的大型 CT 扫描,同时占用不到 2GB 的 GPU 内存。尽管取得了这些进步,但在 GPU 资源可能不可用的低资源环境中,例如笔记本电脑或医院成像边缘设备,仍会出现一个关键的考虑因素。因此想到了一个问题:在不影响分割准确性的情况下,调整最先进的腹部分割模型以部署在非 GPU 环境中是否可行?为了探索这种可能性,设置了这个任务来对基于 CPU 的腹部分割算法进行基准测试。此任务在 FLARE 2024 中引入,这是对基于 CPU 的 3D CT 扫描分割模型进行基准测试的第一个挑战。尽管一些参与者在 FLARE 2024 期间实现了更好的分割精度或更快的推理速度,但在整体排名方面,都没有击败 FLARE 2022 的获胜解决方案。结果激励继续组织这项挑战赛,以推动高效细分模型的进一步发展。为了确保与 FLARE 2022&2024 挑战赛的获胜解决方案具有可比性,该任务将使用相同的数据集,其中包括 2050 个用于模型训练的案例。旧验证集和测试集合并为具有 250 个案例的新验证集。我们为本次挑战赛提供了一个包含 300 个案例的新测试集。评估指标包括 DSC、NSD 和运行时间,提供对算法性能的整体评估。完整的数据集包含 2050 个案例。处理大数据需要花费大量的计算和存储。因此设置了两个数据集轨道,允许参与者选择不同的数据集大小进行模型训练。All Data Track:参与者可以使用所有训练数据进行模型开发。核心集数据跟踪:参与者可以自动从未标记的训练集中选择 50 个案例。 数据下载: https://flare-medfm.github.io/ 四、MS-Multi-Spine2025数据集在磁共振图像 (MRI) 上识别多发性硬化症 (MS) 病变是一项复杂且对脑力要求很高的任务,即使对于大多数经验丰富的放射科医生来说,也经常会导致对疾病活动的低估。因此,需要自动化工具来帮助临床医生准确、可靠地识别和量化 MS 病变。迄今为止,医学成像界将精力集中在脑部 MRI 中病变的检测/分割上。为此,在过去几年中,已经组织了几项挑战,以评估与手动描绘相比,自动化方法检测多发性硬化症 (MS) 病变的能力。这些使社区能够探索创新方向。然而,在临床上,与脑病变相比,脊髓病变的存在具有重要的预后价值。此外,它们的检测对放射科医生来说是一项艰巨的任务。事实上,由于特定特征(例如,健康和病理组织之间缺乏鲜明的对比,重要伪影的高发生率),脊髓 MRI 中的 MS 病变检测/分割是一项复杂的任务。因此,尽管脊髓 MRI 具有临床重要性,但目前在 MS 患者中未得到充分利用。因此,为临床医生提供能够可靠识别这些脊髓病变的工具将是一个重大的附加值。脊髓病变检测提出了一个特定的方法学挑战。事实上,在临床实践中,强烈建议在一组可用序列中至少获取两个序列,迄今为止没有具体的指南。在实践中,根据中心和上下文,可以提供现有 MR 序列的任意组合。在这个挑战赛中,它代表了一个具体的多序列数据集的复杂情况,我们专注于四个常用的序列:矢状 T2(始终在挑战中提供,并将被视为对段的参考)、矢状 STIR、矢状 PSIR 和 3D MP2RAGE,它们将以不同的组合提供。在实践中,训练集将包括以下采集对:50 对 T2 和 STIR 数据、25 对 T2 和 PSIR 数据以及 25 对 T2 和 MP2RAGE 数据。这些数据来自两个不同品牌的各种 1.5T 和 3T 扫描仪。测试集(未提供给挑战者)将包括以下一组:40 对 T2 和 STIR 数据、20 对 T2 和 PSIR 数据、20 对 T2 和 MP2RAGE 数据以及 20 个 T2、STIR 和 MP2RAGE 数据三联体。此外,它的一些数据将来自第三个扫描仪品牌。
数据下载:https://portal.fli-iam.irisa.fr/ms-multi-spine/
五、SurgVU2025数据集能够从内窥镜视频中检测和追踪手术情境的机器学习模型将带来变革性的干预手段。例如,自动分类手术进展(即阶段 Phase、步骤 Step、任务 Task 或动作 Action)及所使用的器械,或构建自然语言接口以分析视频内容(如视频问答系统),将有助于提升手术表现的评估效率、器械配合效率,以及对手术室资源规划的新型分析方法。实际上,其理论和实际应用前景不仅限于外科手术领域,还具备广泛和深远的影响力。然而,获取用于训练这些模型的数据非常耗费资源和时间。临床视频需要逐帧标注,细致地划分手术类别,并在各种条件下标注手术器械的边界框和/或关键点。此外,标注者还需持续培训,以掌握不断变化的手术技术与器械更新。值得注意的是,在机器人辅助手术中,器械的安装/卸载信息可以通过系统自动提取,从而为视频中的工具出现情况提供弱标注。同时,标准化的手术本体词汇正在被构建,具备客观定义,从而减轻人工标注负担。在本次挑战中一共有两个赛道。第一个赛道要求训练一个模型,利用工具存在数据作为弱标签,在视频中定位工具及其关键点。第二个赛道基于短视频片段生成问题的答案。无论哪个赛道的优胜解决方案,都将显著降低训练模型所需的标注负担,并为大量临床应用场景铺平道路。本次挑战分为两个任务:任务 1:手术器械分类与定位。通过训练集提供的噪声工具存在标签(tool presence labels),对出现的器械进行定位(使用边界框)并分类。任务 2:手术视觉问答(Visual Question Answering)。根据30 秒的视频片段,对开放性问题进行作答。训练标签包括:工具存在标签、手术步骤(surgical steps),以及手术步骤类别的描述信息。本次挑战将使用扩展版本的训练数据和标签,这些数据最初来自 2022 和 2023 年的 SurgToolLoc 挑战。本年度 SurgVU 挑战的第 2 类别还新增了“手术任务标签”,是一个重要补充。测试集也在前两年 SurgToolLoc 挑战数据的基础上进行了扩展。关于数据的具体细节如下:训练数据:该数据集由使用 da Vinci(达芬奇)机器人系统进行手术训练时采集的手术视频组成。在这些训练中,外科实习医生会执行标准操作,比如组织分离、缝合、止血等。数据集中包含 280 段长视频,来自 155 场训练会话。视频以 60 帧每秒(fps)的速度采集,分辨率为 720p(1280 x 720),取自内窥镜的一个通道。这相当于超过 840 小时的手术操作录像,总帧数超过 1800 万帧。在每个片段中:3 个机器人手术器械会被安装并出现在手术视野中,不过在某些片段中,器械可能因遮挡或其他原因暂时不可见。每个片段中最多可包含 12 种器械中的任意 3 种。训练标签:对于训练集中每一次训练会话,提供了两类标签:工具存在(Tool Presence)标签:用于指示在每一帧中安装了哪些机器人手术工具。注意:这些工具存在标签存在噪声(不完全准确)。任务(Task)标签:用于标注视频中每个手术任务的起始和结束时间。这些标签保存在两个 CSV 文件中:tools.csv:包含每种手术工具的安装与卸载时间;tasks.csv:包含每个手术任务的开始和结束时间。注意:由于部分训练会话较长,有些视频被分成了两个或多个部分。在 tools.csv 中使用字段 "install_case_part" / "uninstall_case_part" 来指示工具对应的视频部分,在 tasks.csv 中使用 "start_part" / "stop_part" 来指示任务对应的视频部分。测试数据:测试数据集也由使用 da Vinci(达芬奇)机器人系统进行手术训练时采集的视频构成(与训练集类似):每段视频的长度不固定;视频以 1Hz(即每秒1帧) 进行采样。测试标签:测试集将被标注两类信息:机器人手术工具的边界框(Bounding Boxes):由一批有经验的众包标注者完成。手术步骤(Surgical Steps):由多位具备专业背景的专家进行标注。第2类任务训练数据(Category 2 Training Data):对于第2类任务,数据集的标签已扩展,每个手术任务都附加了详细描述,这些描述存储在每个案例对应的 .csv 文件中的 "matched_description" 列中。这些增强的信息支持参赛队伍开展视觉与语言模型的训练,提供了更丰富的语义细节,例如:每个任务正在执行的具体内容;涉及的解剖结构;外科医生的操作行为;以及使用的手术工具等。第2类任务测试数据(Category 2 – Testing Data):提供的测试数据展示了挑战赛的评估方式:每段 30 秒的视频片段会提供:该手术任务的原始描述;以及一对示例问题与答案。这些信息用于测试模型对手术场景的理解与语言生成能力。
数据下载:
https://surgvu25.grand-challenge.org/data-download/
六、SELMA3D2025数据集在现代生物学研究中,可视化和分析组织和生物体内复杂结构的能力至关重要。光片显微镜(Light-sheet microscopy, LSM)结合组织透明化与特异性染色技术,为观察包括细胞及亚细胞结构、细胞器及其过程在内的多种生物结构,提供了一种高分辨率、高对比度的成像方式。组织透明化技术可以使本身不透明的生物样本变得透明,从而使光线可以深入穿透组织内部,并允许成像试剂(如荧光探针或抗体)进入,同时保留组织的结构完整性和分子内容。通过选择性使用不同的荧光探针或抗体,可以对样本内的特定生物结构进行染色,从而在显微镜下增强其对比度。完成组织透明化和染色后,LSM 能够以快速的速度和高空间分辨率对复杂的生物结构进行三维成像,为神经科学、免疫学、肿瘤学和心脏病学等多个生物医学领域提供宝贵的信息。为了更高效地从 LSM 图像中提取结构和功能、细胞和亚细胞层面的信息,自动图像分析方法逐渐成为科学家们的首选工具。其中,图像分割在识别不同生物结构中发挥着核心作用。但由于 LSM 图像体积庞大(单张图像可包含高达 10000310000^3100003 体素),人工分割过程非常耗时。因此,对自动分割方法的需求日益增长。近年来,基于深度学习的图像分割模型取得了显著进展,提供了有前景的解决方案来实现 LSM 图像分割的自动化。虽然这些模型的分割精度已接近人类专家的水平,但其性能在很大程度上依赖于监督学习,即需要大量高质量的人工标注数据。此外,这些模型通常是任务专属的,只针对特定结构设计,在不同应用中的泛化能力有限。因此,深度学习分割模型在 LSM 图像中的广泛应用仍受到限制,因为每一个特定任务的模型训练都需要具备专业领域知识的专家进行标注。为此,开发具备良好泛化能力、能够适用于多种 LSM 图像分割任务的通用模型至关重要。自监督学习(Self-supervised learning)在这一方面展现出显著优势,它允许深度学习模型在大规模、无标注的数据集上进行预训练,从而学习到对 LSM 图像数据具有普适性和泛化性的表示特征。随后,模型可在较小的标注数据集上进行微调,以完成具体的分割任务。SELMA3D 的目标是为 LSM(光片显微镜)图像分割任务中的自监督学习方法建立评测基准。包括两个部分的训练数据集:第一部分包含来自小鼠和人类的大量未标注的三维 LSM 图像,用于模型预训练;第二部分则提供从三维 LSM 图像中裁剪的带标注的图像块,用于模型微调(fine-tuning)。在 SELMA2024 版本中,根据形态学特征将 LSM 图像中常见的生物结构分为两大类:树状结构(tree-like structures):如血管、神经小胶质细胞(microglia)等;点状结构(spot-like structures):如细胞核、c-Fos+ 细胞、淀粉样β斑块等。需要开发一种通用的自监督学习方法,可以同时提升两类结构的分割效果。最终表现最好的队伍在两种结构上都取得了 Dice 分数超过 70% 的成绩。然而,不同队伍的结果表明,一个单一的自监督学习策略很难同时对两种结构类型都提供一致有效的特征增强。因此,在 2025 年的 SELMA3D 挑战中,重新定义了生物结构的分类方式:孤立结构(Isolated structures):指的是在空间上彼此分离、没有物理连接的结构,例如细胞核、c-Fos+ 细胞、淀粉样β斑块和小胶质细胞;连续结构(Contiguous structures):指的是在结构内部具有物理连续性、各部分连接不间断的结构,例如血管和神经。SELMA3D 2025 挑战将分为两个任务:三维光片显微图像中孤立结构的自监督分割任务,专注于开发用于分割三维光片显微图像中孤立结构(Isolated Structures)的自监督学习(SSL)策略。孤立结构是显微镜研究中最常见的生物结构类型之一,其特点是空间上彼此分离、没有物理连续性或直接连接。常见的孤立结构示例包括:细胞核,特定类型的细胞(如神经元或免疫细胞),病理结构(例如阿尔茨海默病中的 淀粉样β斑块)。三维光片显微图像中连续结构的自监督分割任务,专注于开发用于分割三维光片显微图像中连续结构(Contiguous Structures)的自监督学习(SSL)策略。连续结构是显微图像研究中另一类关键的生物结构,其特点是:结构各部分之间具有物理连续性,各部分无中断地连接在一起,形成一个整体。常见的连续结构包括:血管,淋巴管,神经纤维等。任务一训练数据集由两个子集组成:未标注子集(Unannotated subset)——包含大量来源于小鼠和人类样本的三维 LSM 图像,这些图像展现了孤立结构。总计 30 个高分辨率的大型 3D 图像,每个图像的体素数量超过 2×10102 \times 10^{10}2×1010。该子集未提供标注,用于支持自监督学习预训练,使模型能够学习对孤立结构具有泛化能力的表示特征。带标注子集(Annotated subset)——从与未标注子集中相同类型的孤立结构中精心挑选的 3D LSM 图像块,并提供了精准的人工标注。该子集用于微调模型,以提高孤立结构的分割性能。任务二训练数据集包含两个子集:未标注子集(Unannotated Subset):包含大量来源于小鼠和人类样本的三维 LSM 图像,展现连续结构。共计25 张以上高分辨率图像,每张图像的体素数超过 1×10101 \times 10^{10}1×1010。用于模型的自监督预训练,帮助模型学习对连续结构具备泛化能力的表示特征。标注子集(Annotated Subset):从未标注子集中相同结构中精心挑选的图像块,并由专家提供精准的人工标注。用于对模型进行微调(Fine-tuning),以提升连续结构的分割精度。
数据下载:
https://selma3d2025.grand-challenge.org/dataset/,
https://selma3d2025.grand-challenge.org/dataset-for-task-2/
七、MuCARD2025数据集眼底成像是初级保健中早期发现重大眼科疾病(如糖尿病视网膜病变和青光眼)和指导治疗决策不可或缺的工具。通过无创地观察视网膜血管系统和视神经头的细微变化,眼底检查也可以作为全身健康的指标,使其成为患者管理的第一线。随着高分辨率、基于数码相机的眼底成像的广泛采用,各种成像方式迅速进入临床实践。近年来,基于深度学习的眼底疾病分类模型显示出较高的敏感性和特异性,并已被集成到许多软件医疗设备(SaMD)中,证明了其临床实用性。例如,自动化糖尿病视网膜病变筛查系统和青光眼进展监测工具已经商业化,为诊断支持和患者筛查做出了广泛贡献。然而,大多数模型都是在单一相机类型的数据上进行训练和验证的,这限制了它们在应用于来自新设备或不常用设备的图像时的性能。为了克服这些实际限制,该挑战旨在开发能够在不同相机环境中提供一致诊断性能的人工智能模型。通过眼底疾病多相机鲁棒诊断(MuCaRD)挑战,将评估可推广到未见设备的鲁棒分类算法和仅使用来自新相机的少量样本图像即可快速微调的自适应学习技术。MuCaRD挑战解决了人工智能驱动的眼底筛查的一个关键空白:确保在熟悉和未知的相机系统中保持一致的性能。将在现实的约束条件下开发和测试模型——在一个设备的有限图像集上进行训练,然后在全新的设备上评估鲁棒性和适应性。通过模拟临床和商业部署场景,MuCaRD推广了超越单一数据源的方法,可以快速微调到新的成像硬件。任务 1:零样本分类使用来自单个摄像头的眼底图像进行训练,并在完全看不见的设备上进行评估。执行两个单独的二进制分类器(青光眼与正常,以及可参考的 DR 与不可参考)。隐藏的验证集(来自 Optomed Aurora、Mediworks FC162、Optos Ultra Wide、Canon CR2 的 200 张图像)和类似大小的测试集可确保无数据泄漏。任务 2:小样本测试时适应在验证和测试阶段,利用在线提供的小型支持集(每台新相机 5 张标记图像:1 张正片,4 张负片)来扩展任务 1。模型应在 10 s/图像推理限制内展示动态适应,展示稳健性和高效的微调。AI-READI数据集:由三个Bridge2AI合作站点(UAB, UCSD, UW)的Optomed Aurora和Eidon相机获得的一组严格策划的高分辨率彩色眼底图像。图像涵盖所有四种2型糖尿病严重程度类别,并包括专家验证的糖尿病视网膜病变分期注释、图像质量评分和相关的临床元数据(年龄、性别、糖化血红蛋白、血压、合并症)。该队列被优化为基准零射击模型性能和跨设备泛化。
数据下载:
https://www.codabench.org/competitions/9237/
八、GAVE2025数据集挑战聚焦于分析眼底彩色照片中的血管结构,具体任务包括提取视网膜血管并对其进行动静脉分类。视网膜血管的特征,例如口径和结构,作为多种疾病(包括青光眼、年龄相关性黄斑变性、糖尿病视网膜病变以及高血压)的重要生物标志物,已广泛应用于疾病的诊断与监测。这些生物标志物可以通过眼底彩照这一非侵入性且经济高效的成像技术获取。由于其成本低、操作简便,该技术已被广泛应用于临床实践、科研研究以及国家级筛查项目中。为了对视网膜血管系统进行全面分析,首先需要完成血管的分割,并将其进一步分类为动脉或静脉。由此生成的动静脉分割图能够支持一系列诊断相关特征的量化,例如血管宽度、直径及其曲折度。对这些特征的准确测量,还可以进一步计算出更复杂的生物标志物,例如动静脉直径比(AVR)。除了血管和动静脉的分割,本次挑战还引入了一项新任务:动静脉直径比的自动化测量。该指标与多种心血管疾病密切相关,包括动脉硬化和高血压性病变,这不仅提升了本次挑战的技术深度,也使其在真实医疗场景中具有重要的实际应用价值。任务一:眼底彩照中血管分割——在眼科临床实践中,眼科医生通常会通过观察视网膜血管的状态,辅助判断与血管系统病变相关的疾病。像糖尿病视网膜病变、糖尿病性黄斑病变等常见的致盲性眼病,诊断和解读过程都需要对视网膜血管进行细致的观察与分析。在计算机辅助视网膜血管分析的整体流程中,血管分割无疑占据着核心位置。作为后续深入分析的基础步骤,它对于保证整个分析流程的连贯性和有效性起着决定性的作用。因此,本任务的目的是从眼底彩照中自动分割出边缘准确的血管结构。任务二:眼底彩照中动静脉血管分类——视网膜动脉作为输送富含氧气和营养物质的血液,从心脏流向视网膜及其周围眼部组织的重要血管通道,其特征包括:血管直径相对较细,血管壁较厚,血流速度快,血压高,颜色呈鲜红色。此外,动脉的分支呈树状结构,能够覆盖视网膜的广阔区域。相比之下,视网膜静脉主要负责将含氧量较低、携带代谢废物的血液从视网膜回流至心脏。与同一区域的动脉相比,静脉的直径略粗,血管壁较薄,血流速度较慢,血压较低,颜色呈暗红色。其分支通常沿动脉分支之间的间隙分布,形成收集血液的网络结构。准确地区分视网膜动脉和静脉,对于理解眼部血液循环的生理机制,以及实现疾病的诊断与监测,具有至关重要的意义。因此,本任务要求选手分别完成眼底彩照中动脉和静脉的分割。通常模型可以同时完成血管分割和动静脉分割,但需要针对不同的任务进行优化。诸如血管分割更关注尽可能多的分割出血管结构,而动静脉分割则需要关注对血管的分类。任务三:眼底彩照中动静脉直径比自动测量——动静脉比值,作为一种重要的生物标志物,反映了视网膜血管网络中动脉与静脉的相对直径比例,不仅可用于评估眼部血液循环的正常状态,还是检测多种疾病的敏感指标。在临床实践中,AVR的显著变化通常与多种眼科及全身性疾病密切相关。例如,在高血压性视网膜病变中,AVR的升高往往提示系统性血压的升高,进而导致视网膜血管直径的异常变化;而在动脉硬化中,动脉血管壁的硬化和狭窄也会引起AVR的异常波动。本次挑战赛的数据集由150张使用多种成像设备采集的眼底彩色照片组成,并配有相应的血管分割标注、动静脉分割标注和动静脉直径比测量标注。在初赛阶段,大赛将提供50份带标注的数据用于模型训练,随后将发布另外50份数据集用于验证。大赛还将提供一个在线评测平台,参赛团队可以根据排行榜的排名情况,不断优化和调整模型。在最终阶段,剩余的50份数据集将被用于模型的评估测试。数据集是目前第一个也是最大的采用与眼底彩照配对的荧光素造影图像(FFA)来进行动静脉血管标记的数据集。数据集标注由经验丰富的眼科医生和数据集支持团队合作完成。标注过程中,每一例数据都包含采集对象一只眼睛的眼底彩照图像、一张对应眼睛的动脉完全充盈的荧光素造影图像和至少一张对应眼睛的所有眼底血管充盈的荧光素造影图像。目的是使用两个状态的FFA图像来指导眼底血管动静脉的分辨和标记。相比于眼底彩照,FFA图像成像质量高,可以清晰的显示出血管边沿,细小血管的形态和血管的相对位置关系。同时荧光素造影的原理使得医生在荧光素造影过程中可以采集到仅有动脉充盈的眼底彩照和动静脉全部充盈的眼底彩照。相比于仅基于眼底彩照,这可以帮助标注医生更精确和轻松的分辨出动脉和静脉血管,尤其是细小血管和因为成像原因导致难以分辨的部分。这些图像采集设备包括Topcon NW400、佳能CR-2 AF、科和VX-10i、蔡司VIUCAM200等眼科医院常用的眼底相机。在GAVE挑战赛中,我们将图像以1536x1024分辨率的PNG格式保存。最终的分割掩膜中,红色代表动脉,蓝色代表静脉,绿色代表血管重叠部分。AVR的标注过程基于医生标注的视盘和相应的动静脉血管标注,获取视盘轮廓周围的血管管径,取Top4 的动静脉管径算出最终的AVR值。最终给出的数据集中包含眼底彩照、动静脉血管标记、ROI区域掩膜、AVR值。图片文件均以PNG格式存储,文件命名格式为g_00x.png。AVR值保存在txt文件中,每一行包含文件名和对应的AVR值。在本次比赛的第一个任务中,使用标记的动静脉血管并集作为所有血管的标签并进行评估,第二个任务中分别对动静脉的分割结果进行评估,第三个任务中对选手测量的每一张眼底彩照的AVR值和给出的AVR值进行评估。
数据下载:
https://aistudio.baidu.com/competition/detail/1315/0/datasets
九、UUSIC2025数据集超声成像由于其非侵入性、实时性和成本效益,在生物医学诊断中起着至关重要的作用。它广泛用于各种器官的检查和肿瘤的检测。然而,超声图像的准确分类和分割,尤其是对于不同的器官和肿瘤,仍然是一项具有挑战性的任务。现有方法通常难以在不同的解剖区域和病理学中实现高性能。从技术角度来看,开发能够处理超声图像分析中多项任务的通用模型是非常可取的。这将需要先进的机器学习和图像处理技术来提取有意义的特征并做出准确的预测。这样的模型可能会克服当前方法的局限性,这些方法通常是为特定器官或任务设计的,并且缺乏泛化能力。这项挑战的预期影响是双重的。从技术上讲,它为测试一般模型范式提供了一个很好的平台,促使研究界开发新的算法和模型,以实现更好的超声图像分析。这可能会导致新的特征提取方法和优化策略等发现,这对于验证模型至关重要。从生物医学的角度来看,挑战结果将推动模型走向泛化。精确的通用模型可以帮助临床医生进行诊断,实现更早和更有效的治疗,减少侵入性手术,并强调医学模型进化的必要性。该挑战赛的重点是使用跨多个中心和设备收集的多样化、真实世界的超声数据来评估多器官分类和分割的算法。目标是提高 AI 模型在超声图像分析中的泛化性、稳健性和公平性。开发一个能够跨多个器官和疾病执行多任务处理的单一模型。靶器官包括乳房、甲状腺、肝脏、肾脏、胎头、心脏和阑尾,它们对应于收集的用于重新分配的公开数据集。具体说来:乳房:BUSI、BUSIS、BUS-BRA 数据集(任务:结节恶性肿瘤分类 + 结节分割);甲状腺:DDTI 数据集(任务:结节分割);Liver:Fatty-Liver 数据集(任务:脂肪肝分类);肾脏:KidneyUS 数据集(任务:肾脏轮廓描绘);胎头:胎儿 HC 数据集(任务:胎头轮廓分割);Cardiac:CAMUS 数据集(任务:心脏轮廓分割);附录:附录数据集 (任务:阑尾炎分类)。数据集由两个集合组成:一个公共数据集包和一个由 3 家合作医院提供的数据集包。公共数据集捆绑包包括 7 个器官,共 6740 张超声图像,包含分割和分类任务。来自合作医院的数据集包还包括 7 个器官,有 5262 张图像,同样包括分割和分类任务。
数据下载:
https://www.codabench.org/competitions/9106/
十、ImageTAAD2025数据集Type-A 主动脉夹层(TAAD) 是一种医疗急症,其特征是主动脉内膜突然撕裂,导致血液强行进入主动脉中层。TAAD 的年发病率约为每 10 万人中 3 例。如果未能及时进行手术治疗,TAAD 的预后极差,发病后每小时死亡率约为 1%,三天内不治疗的死亡率可达 50%。尽管手术技术不断进步,目前的手术死亡率仍高达 12%。快速诊断、预后评估和手术规划对于 TAAD 患者的生存至关重要。而要完成这些任务,全面理解患者的解剖结构及相关特征是关键。然而,这些解剖结构和特征非常复杂。在典型的 TAAD 中,主动脉的单一腔被分裂为两个部分:真腔(TL) 和 假腔(FL),其起始于升主动脉。分析连接到假腔的血管,可以定位真腔和假腔之间的破口。当前临床实践中,增强 CT 是诊断和手术规划最常用的成像方式。放射科医生和血管外科医生会详尽分析 CT 图像,以识别如下解剖特征:破口位置(LOT)、分支血管受累(BVI)、假腔面积比例(FLAR)以及真腔塌陷(TLC)。近年来,临床实践中已开始使用手动分割的方式来对这些解剖结构和相关特征进行可视化。然而,由于分割过程耗时且需要专业知识,手动分割并未被广泛应用于常规临床中。目前,TAAD 的自动分割是医学人工智能研究领域的热点问题。为了全面讨论也将 B 型主动脉夹层的分割方法纳入其中,因为其与 TAAD 具有类似的解剖结构。根据 Stanford 分类,A 型夹层涉及升主动脉,B 型则不涉及。由于 TAAD 分割需要识别复杂多变的结构(如真腔、假腔和破口),已有方法通常会根据具体应用进行定制化设计。一些方法结合了主动脉的形态特征来提高分割效果;另一些方法则先分割整段主动脉,再细化分类为真腔和假腔。此外采用半监督学习方法,在利用标注数据的同时引入未标注数据,降低了标注成本的同时提高了分割性能。总体而言,现有存在两个主要问题:缺乏全面的公开数据集。 以往研究主要关注主动脉中真腔与假腔的区分,未考虑主动脉与其分支血管及周围解剖结构之间的关系。但诸如破口位置(LOT)、分支血管受累(BVI)、假腔面积比例(FLAR)及真腔塌陷(TLC)等特征对于指导临床实践至关重要,仅仅识别腔体类型远远不够。此外,目前仍缺乏高质量的 TAAD 公共数据集,限制了 AI 研究的广泛开展。缺乏面向临床的评价标准。当前评估分割结果所用的指标多为像素级别的准确度指标,而未考虑临床特征。这导致评估结果与实际临床可用性之间存在差距。简而言之,目前缺乏一个通用且全面的基准来有效评估各种分割模型。为了解决上述问题并推动该领域发展,提出了 ImageTAAD:首个包含临床导向评估的全面 TAAD 分割数据集。该数据集包含 120 个病例,每例均由医学专家进行精细标注,包含 35 个类别,涵盖主动脉、相关分支动脉及主要器官,全面反映了临床诊断、预后评估和手术规划的实际需求。此外,基于临床实践识别了 TAAD 的四个关键临床特征:破口位置(LOT),分支血管受累(BVI),假腔面积比例(FLAR),真腔塌陷(TLC)。为了评估这些特征,提出了一套新的分割评估标准,包括从分割结果中提取临床特征的方法和相应指标的计算方式。该标准重点评估分割结果能否准确反映关键临床特征,而不仅仅是像素层面的准确度,更贴合临床应用实际。毕竟,临床医生更关心的是分割是否能准确反映相关临床特征,而不是某些小幅提升的 DSC 指标。数据集包含 120 例病例,每例病例均由医学专家进行标注,涵盖 35 个前景类别,充分反映了 TAAD 诊断、预后预测和手术规划的临床需求。
数据下载:
https://www.kaggle.com/datasets/xiaoweixumedicalai/imagetaad/data
本文使用 文章同步助手 同步