登录注册写文章

vgg-8s、vgg-16s、vgg-32s

vgg-8s、vgg-16s、vgg-32s

解释VGG中的vgg-8s、vgg-16s、vgg-32s

image

第一行对应FCN-32s，第二行对应FCN-16s，第三行对应FCN-8s

（1）网络里面有5个pool，所以conv7的特征图是原始图像1/32，假设最左边image的是32x32，看到pool1是16x16，pool2是8x8，pool3是4x4，pool4是2x2，pool5是1x1，所以conv7对应特征图大小为1x1，然后再经过32x upsampled prediction 图片变回32x32

（2）FCN-16s的upsample过程
FCN作者在conv7先进行一个2x conv7操作，其实这里也只是增加1个卷积层，这次卷积后特征图的大小为conv7的2倍，可以从pool5与2x conv7中看出来，此时2x conv7与pool4的大小是一样的，FCN作者提出对pool4与2x conv7进行一个fuse操作（事实上就是将pool4与2x conv7相加），fuse结果进行16x upsampled prediction，与FCN-32s一样，也是增加一个卷积层，卷积后的大小为输入图像的16(2^4)倍，我们知道pool4的大小是2x2，放大16倍，就是32x32，这样最后图像大小也变为原来的大小，至此完成了一个16s的upsample

（3）这是我们看第1行与第3行，忽略32x upsampled prediction，conv7经过一次4x upsample，即使用一个卷积层，特征图输出大小为conv7的4倍，所以4x conv7的大小为4x4，然后pool4需要一次2x upsample，变成2x pool4，大小也为4x4，最后把4x conv7，2x pool4与pool3进行fuse，得到求和后的特征图，最后增加一个卷积层，使得输出图片大小为pool3的8倍，也就是8x upsampled prediction的过程，最后也得到一个end to end的图像

FCN-8s均优于FCN-16s，FCN-32s

我们可以发现，如果继续仿照FCN作者的步骤，我们可以对pool2，pool1实现同样的方法，可以有FCN-4s，FCN-2s，最后得到end to end的输出。这里作者给出了明确的结论，超过FCN-8s之后，结果并不能继续优化

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

深度学习与TensorFlow:FCN论文翻译(二)
文章超长了,接上篇 Fully convolutional networks Each layer of data...
云时之间阅读 4,150评论 0赞 3
task7 FCN分析
1. FCN 论文学习 1.1 写作背景卷积网络是视觉处理中可以有效生成多层特征的架构，是最前沿的技术。因此作者...
不存在的里皮阅读 997评论 0赞 1
[译] 用于语义分割的全卷积网络FCN（UC Berkeley）
题目：用于语义分割的全卷积网络文章链接：《Fully Convolutional Networks for Se...
zhwhong阅读 16,725评论 1赞 36
task 7_修改 FCN(图像读取使用开源代码)
1. FCN 论文学习 1.1 写作背景卷积网络是视觉处理中可以有效生成多层特征的架构，是最前沿的技术。因此作者...
不存在的里皮阅读 1,117评论 2赞 1
情报分析心理学C1-3
人名卡人名：小理查德·霍耶兹（Richard J.Heuer，Jr）印象：中情局资深教育家、理论家和反情报专家...
无方Louie阅读 662评论 0赞 1

赞1赞

赞赏

手机看全文