行人重识别(Person re-identification)被广泛认为是一个图像检索的子问题,给定一个监控行人图像检索跨设备下的该行人图像、
特征提取:学习能够应对在不同摄像头下行人变化的特征;
度量学习:将学习到的特征映射到新的空间使相同的人更近不同的人更远
图像检索:根据图片特征之间的距离进行排序,返回检索结果
数据集中:训练、测试中人物身份不重复
数据集分为单帧(每张图片各有一个ID),序列(多张图片为一个序列)
表征学习:把行人重识别人物当作分类问题或者验证问题
度量学习:在行人重识别上,表现为同一行人的不同图片间的相似度大于不同行人的不同图片
表征学习:
分类损失和验证损失
度量学习:
学习出两张图像的相似性
定义一个映射网络,对距离进行度量,设计一个度量损失,获得最小的度量损失,使得相同行人两张图片距离尽可能小,不同行人图片距离尽可能大,用到了聚类的思想。
对比损失(Contrastive loss):
每次输入一对图片,进入同一个CNN网络,分别提出一个特征,计算距离之后,拉近正样本对(y=1)间距离趋于0,推开负样本对(y=0)间距离大于α。
度量学习训练比较随机,需要一定的训练经验
度量学习的分布式训练不太成熟,通常需要自己实现部分代码

QQ截图20210415123540.jpg
表征学习,对特征进行处理,可以规划到一个球面上;可以算cos距离,夹角与半径无关
度量学习,聚类,算特征值直接计算距离就可以了