AlexNet提出后,很多人在此基础上做了改进,其中两个方面的改进最有成效。
1、小卷积核
2、多尺度
VGG就是小卷积核中的典型。
其网络结构如下图
VGG是在模仿Alex的结构,然而它通过降低filter的大小,增加层数来达到同样的效果。
整体使用的卷积核都比较小(3x3),使用3x3是它是可以表示「左右」、「上下」、「中心」这些模式的最小单元了。
使用多个较小卷积核的卷积层代替一个卷积核较大的卷积层,一方面可以减少参数,另一方面进行了更多的非线性映射,可以增加网络的拟合/表达能力。本质上就是将5x5和7x7这样的卷积分解为多个3x3的卷积的堆叠先后出现了VGG16和VGG19,16和19的意思是13+3与16+3;通过替换卷积核的大小,网络越来越深;表达能力越来越强。