RRCNN_2017_三星中国

图片.png

整体结构包括RPN提取,多尺寸roipooling,然后预测三部分:目标分数,外接矩形框,一般四边形。

基于faster rcnn

  • 微调anchor
    将anchor的尺寸调小,增加一个更小的anchor,让其更适用于检测小目标。
  • 使用不同尺寸的pooling
    在7x7的基础上增加了3x11(更精细提取竖直方向特征)和11x3(更精细提取水平方向特征)。
  • 同时回归水平矩形框和倾斜矩形框
    尽管最终目的是得到倾斜矩形框,但是同时预测水平矩形框有助于更准确的预测倾斜矩形框。
  • 使用倾斜NMS对于检测临近目标更有效,不会漏检测。


    图片.png
  • 损失函数
    倾斜矩形框预测左上角,右上角的四个坐标,以及高度h。偏移量的定义方式和fasterrcnn一样。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容