由于SSD的主干网络是VGG16,出于对“低层features map的感受野较小,高层的感受野较大”的结论进行挖掘,因此对VGG16网络中的感受野进行了计算。
1.什么是感受野
感受野的定义:神经网络中每一层输出特征图上的像素点在输入图片上的映射的区域大小,也就是特征图上的每一个点对应的输入图片的区域。
2.怎样计算感受野
感受野的计算公式:
即:第i层的感受野的结果与i-1层结果以及i层的步长和卷积核大小有关
从公式即可解释结论
3.具体事例计算感受野
先具体的我以VGG16网络来计算一下:
在VGG16中:pool5中
pool5:RF=2
conv5_3 :RF=(2-1)*1+3=4
conv5_2 : RF=(4-1)*1+3=6
conv5_2: RF=(6-1)*1+3=8
conv5_1: RF=(8-1)*2+2=16
pool4 : RF=(8-1)*2+2=16
conv4_3: RF=(16-1)*1+3=18
conv4_2: RF=(18-1)*1+3=20
conv4_1 : RF=(20-1)*1+3=22
pool3: RF=(22-1)*2+2=44
conv3_3: RF=(44-1)*1+3=46
conv3_2: RF=(46-1)*1+3=48
conv3_1: RF=(48-1)*1+3=50
pool2: RF=(50-1)*2+2=100
conv2_2: RF=(150-1)*1+3=152
conv2_1: RF=(152-1)*1+3=154
pool1: RF=(154-1)*2+2=208
conv1_2: RF=(208-1)*1+3=210
conv1_1: RF=(210-1)*1+3=212
计算结果为:pool5输出的特征图在输入图片上的感受野为212*212
具体每一层情况如下图:
下一步将对SSD每一特征图的感受野进行计算,以及SSD网络的学习。
以上如有错误,谢谢大家指正