YOLOV5是在YOLOV4的基础上进行了小幅的改进,这个目标检测算法是当前工业界最为常用的一种算法,主要是代码维护的好,有各种版本用于开发,对于一些着急使用但深度学习知识不太足的开发者相对友好,接下去我总结了一下这个算法相对亮点的地方:
- Focus结构: 引入了Focus结构,该结构通过切片和拼接操作来有效地进行特征图的下采样,同时增加网络的通道数,以保留更多的图像信息。这种设计在不增加计算量的前提下,提升了特征的表达能力。在后续版本中,为了计算效率,Focus结构有时被6x6的卷积层所替代,但这一变化也体现了对硬件优化的考虑。
- 自适应anchor计算:这个方法其实就是将原本需要单独运行的脚本集成到训练代码里面来了,就是做了一个端到端的优化。
- 网络结构的优化:比如进一步扩展了csp结构的使用,yolov4对于csp的方法只在骨干网络中使用,yolov5将他扩展到了neck部分,进一步优化了计算性能。