Multi-Similarity Loss with General Pair Weighting for Deep Metric Learning

Multi-Similarity Loss with General Pair Weighting for Deep Metric Learning(PDF)


Author:Xun Wang, Xintong Han, Weilin Huang, Dengke Dong, Matthew R. Scott CVPR2019 (Citations:237)

核心思想:

       根据本文一作在知乎上的回答,本文的一大亮点是提出了通用对加权框架,基于该框架可以对市面上常见的Loss进行分析,提取出其关于对相似度的加权求和形式,以更加深入的理解不同类型的Loss的本质所在。

问题引入:

       深度度量学习的一大分支是基于对(pair-wise)的度量学习,它们的损失函数通过嵌入空间中的对余弦相似度来进行计算表达(比如说对比损失,三元组损失,三元组-中心损失,四元组损失,提升结构损失,N对损失,二项偏差损失,直方图损失,三角损失,基于距离加权余量损失,层次三元组损失等)。该领域中的方法需要将单个的样本进行构建使其形成对、三元组或四元组的形式。在这种情况下,训练样本数量会被冗余对淹没,导致收敛速度减慢,模型退化。因此,在深度度量学习中,提升采样策略的效果至关重要。

解决方案:

1.通用对加权框架(General Pair Weighting Framework, GPW Framework)

       在本文中,作者将度量学习中的采样问题定义为一个统一的加权视角,提出了通用对加权框架(General Pair Weighting Framework, GPW Framework)来分析不同的基于对的损失函数。

      首先,作者将基于对的损失函数L定义为关于相似性矩阵S和标签y的函数L(S,y)。那么,在t时刻关于模型参数\theta 的导数可通过如下公式计算得到:

图1 损失函数关于模型参数的导数

       我们从该导数可推导出其原函数F(S,y)

图2 上述导数的原函数

其中,乘积的第一项(导数项)为常量,并且在基于对的损失函数中,我们可以假设对于正样本对,该常量小于等于0;对于负样本对,该常量大于等于0。我们将损失函数根据正负样本对进行分类讨论,将损失函数划分为两部分:

图3 基于对的加权函数

其中,S_{ij} 是样本对的相似度,\omega _{ij} 为该样本对的权重。该函数将基于对的损失函数学习转变成了设计对的权值,即我们可以通过改变对的权值大小来控制损失。

       搭建完通用对加权框架后,本文对四种常见的损失函数进行了权值分析:

       1.对比损失:通过计算对比损失关于相似性矩阵的偏导数可以发现,所有的正样本对和相似性大于阈值的负样本对都被赋予了相同的权值。

图4 对比损失

        2.三元组损失:对于加上余量后相似性大于正样本对的负样本对,三元组损失会平等地对待这些难例。而对于加上余量后相似性仍小于正样本对的负样本对则会被丢弃。虽然三元组损失的采样策略与对比损失有所不同,但本质上仍然会平等地对待所有的被选择的样本对。

图5 三元组损失

        3.提升结构损失:提升结构损失关于相似性矩阵的偏导数如图7图8所示,可以看到,正样本对的权重由其相对相似性来决定,通过与具有相同锚点的正样本进行比较来衡量其权重(负样本对则与其他具有相同锚点的负样本进行比较)。

图6 提升结构损失
图7 正样本对权重
图8 负样本对权重

       4.二项偏差损失:可以看到,二项偏差损失是对比损失的软版本,对于具有更高相似性的负样本对会被赋予更大的权重。

图9 二项偏差损失
图10 正负样本对权重

2.多重相似性损失(Multi-Similarity Loss)

       本文首先总结了以下三种类型的负样本对相似性:

       1.Similarity-S:自相似性(Self-similarity)被定义为锚点与负样本之间的余弦相似性。具有更大的自相似性的负样本对意味着它更具有判别性更难被区分,因此携带有更多的信息和意义。需要被赋予更大的权值。对比损失和二项偏差损失基于该准则。

       2.Similarity-P:正相对相似性(Positive relative similarity)被定义为自身的余弦相似度和其它正样本对的差异。三元组损失和直方图损失基于该相似性准则。

       3.Similarity-N:负相对相似性(Negative relative similarity)被定义为自身的余弦相似度和其它负样本对的差异。提升结构损失,N对损失和NCA方法基于该策略。

图11 三种类型的负样本对相似性

       基于上述三种类型的负样本对相似性,作者对目前常见的基于对的深度度量方法涉及到的相似性种类进行了总结:

图12 基于对的度量方法涉及到的相似性种类

并在此基础上提出了多类相似性损失(Multi-Similarity Loss, MS Loss),通过执行对加权策略来综合考虑上述三种类型的相似度。该策略由两个步骤组成:(i)根据正相对相似性来筛选富含信息的样本对;(ii)结合自相似性和负相对相似性来进一步对所选的样本对进行加权。

       1.样本对挖掘:首先提取最难的正样本对(即具有最低相似度的正样本对)和负样本对(即具有最高相似度的负样本对)。然后将其他正负样本对与这两种最难例进行比较,提取满足下述条件的样本对:

图13 正负样本对的筛选条件

(Ps:画了幅二维平面的示意图,红色圈之外的正样本以及黄色圈之内的负样本是需要进行提取的)

图14 二维平面示意图

        2.样本对加权:通过上述挖掘过程,可以粗略地筛选得到富含信息的样本对,丢弃掉对模型训练无影响的低信息量样本对。接下来,通过软加权策略,结合自相似性和负相对相似性对所选的样本对进行进一步的加权。正负样本对的权重可通过如下公式计算得到:

图15 正负样本对权重

其中,自相似性由项e^{(\lambda -S_{ij} )}计算得到,负相对相似性由项e^{S_{ik}-S_{ij}}  确定。

       最后,根据上述权重可以推导出其原函数即多类相似性损失,其关于相似性矩阵的偏导数即为上述正负样本对权重。

图16 MS Loss
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352

推荐阅读更多精彩内容