InceptionV3:
为解决问题:由于信息位置的巨大差异,为卷积操作选择合适的卷积核大小就比较困难。信息分布更全局性的图像偏好较大的卷积核,信息分布比较局部的图像偏好较小的卷积核。非常深的网络更容易过拟合。将梯度更新传输到整个网络是很困难的。简单地堆叠较大的卷积层非常消耗计算资源。
InceptionV3层数到底几层:请参考 深度学习之基础模型-Inception-V3
所以很难去描述Inception这种结构有多少层,因为不是简单的层的堆叠,所以6个卷积层+10个Inception结构,Inception结构有三类,再加全全连接层(分类器),一般全链接层是2~3层结构。
解决方案:
为什么不在同一层级上运行具备多个尺寸的滤波器呢?网络本质上会变得稍微「宽一些」,而不是「更深」。作者因此设计了 Inception 模块。
下图是「原始」Inception 模块。它使用 3 个不同大小的滤波器(1x1、3x3、5x5)对输入执行卷积操作,此外它还会执行最大池化。所有子层的输出最后会被级联起来,并传送至下一个 Inception 模块。