1.输入层是28283的图像,filter为333的滤波器。那么3个通道的filter会相应的每一个通道相互独立计算,然后再将3个通道的值相加在一起。
这就是每一个filter的计提的计算过程。现在就是CNN卷积的处理过程。
2.假设输入音量大小为[32x32x3](例如RGB CIFAR-10图像)。如果接受域(或过滤器大小)是5x5,那么Conv层中的每个神经元将具有权重到输入体积中的[5x5x3]区域,总共5 * 5 * 3 = 75个权重(和+1偏置参数)。请注意,沿深度轴的连接范围必须为3,因为这是输入音量的深度。