一、U-net简介
U-net
U-Net 是一个Encoder-Decoder的结构(与 FCN 相同),前半部分是特征提取,后半部分是上采样。
Encoder(contracting path):左半部分,由两个 3x3 的卷积层(ReLU)+ 一个 2x2 的 maxpooling 层组成一个下采样模块。
maxpooling(2*2):scale/2
(作用:在通过卷积等操作获取上下文的特征信息)
Decoder(expanding path):右半部分,由一个上采样的卷积层 + 特征拼接 concat + 两个 3x3 的卷积层(ReLU)构成一个上采样模块。
up-conv:scale*2
(作用:是在进行目标对象的定位)
572*572*1——>388*388*2
chin(输入) chout(输出)kernelsize(卷积块大小) padding(填充) stride(步长)scale(图像原尺寸)scale-new(卷积后图像新尺寸)
卷积公式:
scale-new=(scale-Kernelsize+2*padding)/(strides+1)
二、UNet网络结构高性能的原因分析
1、 多尺度获得信息
在encoder操作中,采用了5个池化层(在实际应用中也有采用4个池化层的操作),在不断的下采样过程中不断的降低分辨率以获得不同尺度的图像信息,图像的信息由底层信息中的点、线、梯度等信息逐渐向高程信息中的轮廓以及更抽象的信息过度,整个网路完成了“由细到粗”特征的提取与组合,使UNet得到的信息更加全面。
2、神来之笔skip connention
图像从低分辨率转高分辨率图像会失真(decoder部分);而高分辨率转低分辨率则失真相对可忽略,也保留了更多的细节信息(encoder部分)!因此,在decoder中上采样过程中就失去了对细节信息的敏感。这个时候skip connection就成为真正的神来之笔,此操作将同层高度的encoder更精准的梯度、点、线等信息直接Concat到同层的decoder中,相当于在判断目标大体区域内添加细节信息,这种操作当然可以使UNet获得更准确的分割结果。