论文阅读"PiCO: contrastive label disambiguation for partial label learning"

Wang H, Xiao R, Li Y, et al. PiCO: Contrastive Label Disambiguation for Partial Label Learning[J]. arXiv preprint arXiv:2201.08984, 2022.

摘要翻译

在这项工作中,作者通过在一个连贯的框架中解决PLL中的两个关键研究挑战——表示学习和标签消歧——来弥补这一差距。具体来说,所提出的框架PiCO由一个对比学习模块和一个新的基于类簇原型的标签消歧算法组成。PiCO为来自相同类簇的样本示例生成紧密对齐的表示,并便于标签消除歧义。

任务背景介绍
任务数据说明

该论文主要研究的是partial label learning(PLL)问题。该问题可以定义为如下:首先给定\mathscr{X}为输入空间, \mathscr{Y}为输出标签空间。考虑如下的训练数据集\mathscr{D}=\{(x_i,Y_i)\}_{i=1}^n,每一个元组由一张图片x_i \in \mathscr{X}和一个候选的标签集合Y_i \in \mathscr{Y}组成。依照监督学习任务的设定来讲,PLL的目标是通过关联样本来学习一个可以预测正确标签的映射函数。二者之间的不同点是,PLL的建立可以容忍标签空间的不确定性。PLL任务的基础假设是输入样本x_i所对应的真实标签y_i是隐藏在其候选标签集合Y_i中的,但在学习过程中该标签不可见。正是因为这个原因,相较于监督学习任务中给定正确标签而言,PLL在学习中容易受到固有歧义的影响。

可以看出,PLL任务中最关键的问题在于如何从给定的候选标签集合中识别出真实标签。在训练中,为每个输入图片x_i分配一个标准化向量s_i \in [0,1]^C作为伪目标,向量中的每个元素表示每个标签可能是真实标签的概率。为Y_i中每个标签分配的概率之和为1。该s_i将会在训练的过程中进行更新。理想情况下,s_i 应该在训练过程中将更大的概率放在(未知的)真实标签 y_i 上。在训练中,以s_i为目标,用交叉熵损失来训练分类器f

由此,每个样本的损失由以下形式给出:
其中,j代表着标签的下标。s_{i,j}为输入x_i的第j个标签。这里的映射学习f是网络经由softmax的输出,并将f^j作为它的第j个entry。

模型浅析

对于PLL任务,主要包含表示和标签学习两个关键问题,当然这两个问题是可以进行同时优化的。

  • 表示学习
    标签空间中的不确定性使得学习有效表示遇到了障碍。在PiCO模型中,作者在等式中的分类损失(1)中结合了一个对比学习的损失项,促进了在嵌入空间中的聚类效果。作者指出,将对比学习运用到PLL中,最大的挑战在于正例样本集合的构建。
    (1)训练目标。关于对比损失项,作者采用的是MoCo和SupCon中标准的对比损失。对于给定的样本(x,Y),首先通过随机的数据增强函数Aug(x)产生了两个视图--query视图和key视图。然后两张图片分别被喂入query网络g(\cdot)和key网络g'(\cdot),返回一对由L_2标准化的嵌入表示q=g(Aug_q(x))k=g'(Aug_k(x))。与Moco中设置一致,key网络由query动量更新。此外,作者还维护了一个存储最新key嵌入k的队列,并且按照时间序列更新该队列。至此,作者给出了可以用于对比学习的embedding池:

    因此,给定一个样本x,该样本的对比损失可以由其query嵌入和对比嵌入池中的其他部分定义:
    其中,P(x)为正例集合,A(x)=A 除去{q}之外的元素形成的集合
    (2)正例集合的选取。作者建议使用分类器的预测标签\tilde{y}=argmax_{j \in Y}f^j(Aug_q(x))。并且将预测的标签严格限制在候选标签集合Y中。因此正例满足
    \tilde{y}'是训练样本k'对应的预测标签。为了提高计算效率,作者还维护了一个标签队列来存储过去的预测值。换句话说,作者将x的正例集合定义为那些携带相同的近似标签预测\tilde{y}的样本。
    至此就可以联合训练分类器和对比学习的网络。总体的损失函数如下:

    在这种结构下,模型可以通过CL学习高质量表示的目标依赖于准确的分类器预测的正例集合选择,这使得在存在标签歧义的情况下,问题仍然没有得到解决。

  • 基于原型的标签消歧技术
    为了更好的解决样本表示依赖于正例选择的问题,作者以一种协同算法的形式引入了基于原型的标签消歧策略。作者提出了原型嵌入(prototype embedding)向量\mu_c,该向量和每个类簇c \in \{1,2,3,..,C\}对应。利用聚类的思想,关于伪标签的分配,一个简单的版本是找到当前嵌入向量的最近的原型嵌入。此外,作者还通过使用移动平均样式公式来软化这个硬标签分配版本。在这种前提下,可以直观的假设原型的应用通过对比项在嵌入空间中建立了和聚类之间的关联性。
    (1)伪标签的更新。首先作者使用均匀分布初始化伪标签:

    之后通过平均移动的机制来对其进行迭代更新
    其中,\phi \in (0,1)\mu_j是第j的类簇对应的原型嵌入。使用移动平均策略,可以平稳地将伪目标更新到正确的目标,同时确保稳定的训练动态。
    (2)原型的更新。
    更新原型嵌入的最典型的方法是在训练的每次迭代中计算它。然而,这将产生巨大的计算代价,进而导致难以忍受的训练延迟。因此,作者提出同样以移动平均的方式更新class-conditional原型向量:
    其中,类簇c的动量原型嵌入\mu_c由预测类簇符合c的归一化query嵌入q的移动平均值定义。\gamma是用于平衡的超参数。

  • 协同解释
    首先,由于对比项有利地表现出嵌入空间中的聚类效应,标签消歧模块通过设置更精确的原型进一步利用。其次,一组优化的标签消歧结果可能反过来回报正例集合的构造,这是对比学习阶段的关键部分。


PLL任务感觉让人很容易接受。并且在模型的构造上,虽然没有很明显的使用聚类的方法,但是利用对比学习捕获聚类友好的嵌入空间表示,并且在伪标签的更新中使用了计算当前样本嵌入q和类簇原型嵌入表示\mu_j之间的相似性来更新伪标签,无疑中也使用了聚类中计算样本表示和类簇中心表示的思想。巧妙的通过这种联系,建立起样本和标签之间的关联性,为PLL任务提供了很好的思路。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容