第十九天

第十九天

分类+定位

image.png

置信度是分类任务交叉熵
定位是回归任务均方差（很少用）交集和并集的比例

image.png

越接近1越好 0.5为可接受值小于0.5的就不要了

多个特征值预测出多个框

image.png

分类任务交叉熵

三部分合并在一起构成损失函数
然后梯度下降求极小值

image.png

fpn特征金字塔
感受野
上采样: 卷积反卷积最临近插值法双线性插值法
concat：深度方向组合变多通道

R-CNN:第一代模型
SS：选择性搜索时间大概是2s
使用的alexnet 然后svm二分类

image.png

正样本 / 负样本
ROL 感兴趣区域

非端到端（端对端）的模型

是否端对端魔性评测优劣的标准

20个类别，计算每个类别的
TP真正例
Fp 假正例
FN 假反例

image.png

mAP：平均ap值（重点）面试会问

image.png

RPN （区域提议网络）预测rp区域
只需要10毫秒

faster R-cnn是完整的端到端
锚点的尺度相当于宽高设置三个比例设置三个生成3 * 3 的9张图

image.png

框偏移之间的误差
Ground Truth是什么？？
ROI pooling 原理是什么？？

image.png

yolo是比较深的神经网络

image.png

v1:
24层
简化版9层

v2:
SSD 多规格检测
DarkNet19
以不同的尺寸运行:输入大小可以不一样最后没有全连接了或者使用ROL POOLING

v3：
多尺度检测
引入残差块能做的更深

在每个卷积层后加Batch Normalization(BN)层默认规则
通过使用BN层使得
mAP提高了2%
fine-tuning（微调）

均值移除？？
Convolutional With Anchor Boxes 不用拉伸成一维输入尺寸可以不同还会有锚点框类似于RPN

image.png

resn残差组

image.png

最后编辑于：2025.01.08 18:01:48

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。