yolov3相对于先前的网络改进点:
1.使用更多的shotcut,构造更深的darknet-53(ResNet提出来的)
2.使用三层feature map分别对应不同尺度的anchor(SSD,FPN已经这样做过了)
3.由于softmax分类loss前提假设是每个对象只属于一个分类,对于有包含关系的类别,softmax没那么适用,于是yolov3使用了逻辑回归的方法做分类,同时回归一个anchor属于多个类的概率,ground truth值是0或1,分别代表一个anchor是否与ground truth box相匹配。
网络结构如下: