卷积层操作维数变化理解

卷积神经网络中的卷积层操作使得输入输出维数的改变

以原始图片输入卷积神经网络做卷积操作,原本的RGB通道数为3,即表示输入维数为3,设定输出维数为64,则需要对输入的3维图像用64个卷积核卷积(每个卷积核又分为3层,对应输入的3维,可视作每个卷积核都是一个立方体,而不是单一的一层卷积核)。


卷积核层数个数简图

如此卷积过后对每个立体卷积核每层卷积后得到的特征图处理得到一个特征图,通过64个立方体卷积核的操作即可得到64张特征图,从而生成了新的64维数据,完成了卷积操作维数的变换。
卷积维数变换代码的实现如下:

nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容