文章:Deep Learning in Medical Image Registration: A Survey [paper]
主要是翻译,水平有限大致翻译一下 ,emmmmm大致看得懂,就凑合着看把 。
4、监督学习变形配准方法
尽管前面描述的方法取得了一定的成功,但是这些方法中的转换估计是通过迭代实现的,这可能导致配准较慢。特别是在可变形配准的情况下,解空间是高维的[70]。这推动了可以在一个步骤中估计出对应于最优相似性的转换的网络发展。然而,完全监督的转换估计(仅使用真实数据来定义损失函数)有几个挑战,本节将重点介绍这些挑战。
图5给出了有监督变换估计的可视化,
表2给出了著名作品的描述。其中高亮显示的只是我目前看的文章,没有其他意思
4.1 全监督转换配准
在本节中,我们研究了使用完全监督的方法实现单模态配准。与迭代优化方法相比,使用神经网络执行配准可以显著加快配准过程。
4.1.1 本章梗概
由于本节讨论的方法使用神经网络直接估计转换参数,因此使用可变形转换模型不会引入额外的计算约束。可变形转换模型通常优于刚性转换模型[96]。本节将首先讨论使用刚性转换模型的方法,然后讨论使用可变形转换模型的方法。
4.1.1.1刚性配准
Miao et al. [89, 90]首先使用深度学习来预测刚性转换参数。他们使用CNN来预测与二维/三维x射线衰减图和二维x射线图像刚性配准相关的变换矩阵。提出了将6个转换参数划分为3组的层次回归方法。通过对对齐数据的转换,合成了地面真值数据。下面介绍的三种方法也是如此。该方法优于基于MI、CC和梯度相关的迭代配准方法。
Chee et al. [16] 使用CNN预测了用于刚性配准三维脑MR的转换参数。在仿射图像配准网络(AIRNet)的框架中,利用预测仿射变换与真值仿射变换之间的MSE对网络进行训练。在单模态和 多模态情况下,它们都能比基于迭代MI的配准性能更好
Zheng et al. [143] 此外,郑等[143]提出将成对域适应模块(PDA)集成到预训练CNN中,利用有限的训练数据对术前三维x线图像和术中二维x线图像进行刚性配准。采用域自适应的方法,解决了用于训练深度模型的综合数据与实际数据之间的差异。
Sloan et al. [116] 利用CNN对T1和T2加权脑mr配准的刚性转换参数进行回归,研究了单模态配准和多模态配准。构成卷积层的参数只在单模态情况下共享,卷积层用于提取每张图像的低层特征。在多模态情况下,这些参数分别学习。这种方法也优于基于MI的图像配准。
4.1.1.2 可变形配准
与上一节一样,我们将讨论同时使用真实和合成的ground truth标签的方法。首先讨论使用临床/公开可用的ground truth标签进行训练的方法。这种顺序反映了一个事实,即模拟真实的可变形转换比模拟真实的刚性转换更困难。
Yang et al. ]用FCN一步就预测出了形变场,FCN用于记录二维/三维主体间脑MR。这种方法使用了类似于U-net的体系结构[103]。此外,他们还利用大的差形度量映射(large diffeomorphic
metric mapping )作为基础,利用图像像素的初始动量值作为网络输入,对这些值进行演化,得到预测的变形场。该方法优于基于半耦合字典学习(semi-coupled dictionary learning based)的配准[11]。
Rohe et al.. [102]也使用U-net [103] 启发的网络来估计用于配准三维心脏MR体积的形变场。采用网格分分割法计算给定图像对的参考变换,并以预测与真正之间的SSD作为损失函数。该方法优于基于LCC Demons的配准[80]。
Cao et al. [13] 使用CNN将一对3D脑MR的输入图像块映射到各自的位移矢量。对于给定的图像,这些位移矢量的总和构成用于进行配准的变形场。此外,他们利用输入图像块之间的相似性来指导学习过程。此外,他们使用了均衡的活动点引导采样策略,使得梯度大小和位移值较高的patch更有可能被采样用于训练。该方法优于基于SyN[5]和Demons[127]的配准方法。
Jun et al. [82] 利用CNN对腹部MR图像进行可变形配准,以补偿呼吸引起的形变。该方法的配准效果优于非运动校正配准和局部仿射配准。
Yang et al.【136】使用变换参数的变分高斯分布的低秩Hessian近似(low-rank Hessian approximation of the variational gaussian distribution),量化了与三维T1和T2加权脑MRs可变形配准相关的不确定性。该方法对实际数据和综合数据进行了验证。
正如深度学习实践者使用随机转换来增强数据集的多样性一样,Sokooti et al. [117] 使用随机DVFs来增强数据集。他们使用多尺度CNN来预测变形场。利用这种变形对三维胸部CT图像进行单个病人图像配准。这种方法使用的是晚期融合而不是早期融合,在早期融合中,patch被连接起来作为网络的输入。该方法的性能与基于b样条的配准具有竞争力[117]。
这些方法在增强数据集的大小和多样性方面具有显著的优势,但能力有限。这些限制推动了更复杂的地面真相图像生成的发展。本节中描述的其他方法为其应用程序使用模拟的地面真实数据。
Eppenhof et al.[31]使用3D CNN对吸气-呼气三维肺CT图像体积进行可变形配准。一系列多尺度、随机的对齐图像对转换消除了手工标注真实数据的需要,同时也保持了真实的图像外观。此外,与生成地面真实数据的其他方法一样,CNN可以在监督下使用相对较少的医学图像进行训练
Uzunova et al. [125] 使用统计外观模型(statistical appearance models, SAMs)生成地面真实数据。他们使用CNN估计了二维脑MR和二维心MR的配准变形场,并用FlowNet[29]实现。他们证明,与使用随机生成的地面真实数据或使用[30]中描述的配准方法获得的地面真实数据进行训练的CNNs相比,使用SAM生成的地面真实数据进行训练的FlowNet具有更好的性能。
与本节中使用随机转换或手工制作方法生成地面真实数据的其他方法不同,Ito等人[56]使用CNN学习生成真实数据的可信变形。他们在ADNI数据集中的3D脑MR卷上评估了他们的方法,并优于[53]中提出的基于MI的方法