分类+定位
置信度是分类任务 交叉熵
定位是回归任务 均方差(很少用)交集和并集的比例
越接近1越好 0.5为可接受值 小于0.5的就不要了
多个特征值预测出多个框
分类任务 交叉熵
三部分合并在一起构成损失函数
然后梯度下降 求极小值
fpn特征金字塔
感受野
上采样: 卷积 反卷积 最临近插值法 双线性插值法
concat: 深度方向组合 变多通道
R-CNN:第一代模型
SS:选择性搜索 时间大概是2s
使用的alexnet 然后svm二分类
正样本 / 负样本
ROL 感兴趣区域
非端到端(端对端)的模型
是否端对端 魔性评测优劣的标准
20个类别,计算每个类别的
TP真正例
Fp 假正例
FN 假反例
mAP:平均ap值(重点)面试会问
RPN (区域提议网络) 预测rp区域
只需要10毫秒
faster R-cnn是完整的端到端
锚点的尺度相当于宽高 设置三个 比例设置三个 生成3 * 3 的9张图
框偏移之间的误差
Ground Truth是什么??
ROI pooling 原理是什么??
yolo是比较深的神经网络
v1:
24层
简化版9层
v2:
SSD 多规格检测
DarkNet19
以不同的尺寸运行:输入大小可以不一样 最后没有全连接了或者使用ROL POOLING
v3:
多尺度检测
引入残差块 能做的更深
在每个卷积层后加Batch Normalization(BN)层 默认规则
通过使用BN层使得
mAP提高了2%
fine-tuning(微调)
均值移除??
Convolutional With Anchor Boxes 不用拉伸成一维 输入尺寸可以不同 还会有锚点框 类似于RPN
resn残差组