ROIs

Faster RCNN中的ROI是单层金字塔,只含有一个层,每层窗口分块不一样。

ROI输入为n个region在原始图片的坐标, [n, r, c, h, w],r,c为某个region的左上角坐标,h, w为高宽。

在ROI层会根据每个region的r,c,h,w来生成其对应的映射特征,因为每个region的特征映射最终连接到FC层,故每个region输出的映射特征尺寸是一样的,所以在ROI层,只需根据region的尺寸,用window pooling生成相应的比例!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容