DCNv2
input[2 3 7 7]
- 输入原图片
- batch
- channels_in
- height
- width
weight[5 3 3 3]
- 5个卷积核
- channels_in = 3
- 每个卷积核二维大小为9(k_h=3, k_w=3, k_depth=channels_in),三维大小为27
offset[2 2*9 7 7]
说明
每个卷积在input上的所有像素操作一次(7x7),每次操作卷积核都有x_offset,y_offset,在一个batch上,有一channels_out个卷积核,这channels_out个卷积核为一个deformable_group,在这个group中,所有的卷集核在input的同一个像素点操作时,共享offsetbatch
x_offset, y_offset
height, width
mask[2 9 7 7]
- 说明
同上; - batch
- w_offset
- height, width
num_kernels
- num_kernels = channels * batch_size * height_col * width_col
- 2x3x7x7