CNN 几个小问题 Q&A

• 什么使CNNs具有平移不变性(translation invariant)?

每个卷积核充当它自己的滤波器/特征检测器。假设您正在进行目标检测,目标在图像中的位置并不重要,因为无论如何,我们将在整个图像中以滑动窗口的方式应用卷积。


• 为什么分类CNNs模型中需要max-pooling?

这是计算机视觉中的一个角色。CNN中的最大池化允许您减少计算量,因为池化后feature maps变小了。您不会丢失太多的语义信息,因为您正在进行最大程度的激活。还有一种理论认为,最大池化对CNNs的平移不变性有一定的贡献。看看吴恩达关于最大池化好处的视频。 https://www.coursera.org/learn/convolutional-neural-networks/lecture/hELHk/pooling-layers


• 为什么在图像分割中CNNs通常具有编码器-解码器结构?

编码器CNN基本上可以被认为是特征提取网络,而解码器使用该信息通过“解码”特征并放大到原始图像大小来预测图像分割区域。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容