菲兹保大学的Olaf Ronneberger等人在2015年提出了一种名为U-net的网络模型。该网络可以用非常少的图像进行端对端训练,并且速度非常快。该网络的结构如下图1。
u-net的主要的特点为:
- 左侧为收缩路径(输出图像大小不断减小),右边为扩张路径。
- 在扩张路径中,在3*3卷积之前的输入图像为收缩路径中响应大小的图像和下一层经过upsampling之后拼接而成的。这是为了使收缩和扩张路径可以具有一定的对称性。
- 网络并没有全连接层,而是只连接必要的卷积层。
- (overlap-tile strategy) 为了不丢失图像信息,对于边界处的图像进行了镜像处理。因为卷积会使图像边缘处的信息丢失。如下图2。
- 该网络应注意的问题要选取合适的输入大小,因为2*2的max-pooling算子适用于偶数像素点的图像长宽。
在生物图像分割中,最为突出了两个挑战是:可获得的训练数据很少;对于同一类的连接的目标分割。本文解决第一个问题的方法是通过数据扩大(data augmentation)。他们通过使用在粗糙的3*3点阵上的随机取代向量来生成平缓的变形。解决第二个问题是通过使用损耗权重(weighted loss),这是基于相邻细胞的分界的背景标签在损耗函数中有很高的权值。如图3。
训练具体细节(待补后续)
参考文献:
【1】Ronneberger O, Fischer P, Brox T. U-Net: Convolutional Networks for Biomedical Image Segmentation[J]. 2015, 9351:234-241.
相关内容:
端对端训练
active learning
FCN