一、语义分割
图像语义分割的目标是标记图像每个像素的类别。
因为我们需要预测图像中的每个像素,所以此任务通常被称为密集预测。
语义分割.png
1.语义分割之U-Net网络
- 网络结构
U-Net网络结构.png
-
Transposed Convolution层
普通的卷积层和池化层是为了缩小输出的尺寸,而Transposed Convolutions的作用正好相反,是为了增大图像的尺寸,同时保留位置的信息。
up conv.png
Transposed Convolution层是图像过采样的最佳选择,它通过误差向后传递算法来学习最佳的权值,使得低分辨率的图像可以转换为高分辨率的图像,效果极佳。
图像放大对比.png
- Conv2DTranspose演示
Conv2DTranspose演示.png
- Conv2DTranspose存在的问题
Conv2DTranspose问题.png
2.语义分割的应用
- 自动驾驶
- 医学图像处理
- 地理感应
- 精准农业
二、实例分割
比语义分割更进一步,除了像素级分割,还需要分别对类的每个实例进行分类。例如,图中有3个人,每个人实例都需要都被分割出来(以不同颜色)。
实例分割.png