Faster RCNN中的ROI是单层金字塔,只含有一个层,每层窗口分块不一样。
ROI输入为n个region在原始图片的坐标, [n, r, c, h, w],r,c为某个region的左上角坐标,h, w为高宽。
在ROI层会根据每个region的r,c,h,w来生成其对应的映射特征,因为每个region的特征映射最终连接到FC层,故每个region输出的映射特征尺寸是一样的,所以在ROI层,只需根据region的尺寸,用window pooling生成相应的比例!
Faster RCNN中的ROI是单层金字塔,只含有一个层,每层窗口分块不一样。
ROI输入为n个region在原始图片的坐标, [n, r, c, h, w],r,c为某个region的左上角坐标,h, w为高宽。
在ROI层会根据每个region的r,c,h,w来生成其对应的映射特征,因为每个region的特征映射最终连接到FC层,故每个region输出的映射特征尺寸是一样的,所以在ROI层,只需根据region的尺寸,用window pooling生成相应的比例!