VGG16网络是在论文《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》中提出的。
VGG16网络结构在论文中有图示如下。请看红框部分,从input(224*224RGBimage)到softmax,就是网络的每一层。从中可以看出:
1. 网络的输入是224*224的RGB图片;
2. 网络有13个卷积层(conv3)、5个最大池化层(maxpool)、3个全连接层(FC)、1个softmax层;
3. 13(卷积层)+3(全连接层)= 16, 这也就是为什么被称为VGG16;
4. 我们常用的4096维度特征,其实是来自全连接层(FC-4096);
5. 最后一个全连接层(FC-1000)的作用,是可以进行1000类的分类,在提取特征的任务中,不使用最后一个层。
VGG16论文中的结构图
有了上面的介绍,再看网络结构图(如下),是不是就特别顺眼,特别好理解。
VGG16网络结构图