卷积神经网络中的卷积层操作使得输入输出维数的改变
以原始图片输入卷积神经网络做卷积操作,原本的RGB通道数为3,即表示输入维数为3,设定输出维数为64,则需要对输入的3维图像用64个卷积核卷积(每个卷积核又分为3层,对应输入的3维,可视作每个卷积核都是一个立方体,而不是单一的一层卷积核)。
卷积核层数个数简图
如此卷积过后对每个立体卷积核每层卷积后得到的特征图处理得到一个特征图,通过64个立方体卷积核的操作即可得到64张特征图,从而生成了新的64维数据,完成了卷积操作维数的变换。
卷积维数变换代码的实现如下:
nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2)