论文粗读“Clustering by Maximizing Mutual Information Across Views”

Do K, Tran T, Venkatesh S. Clustering by maximizing mutual information across views[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. 2021: 9928-9938.

摘要导读

本文提出了一个新的图像聚类框架用于联合优化表示学习和聚类。该框架由两个共享的主干网络头组成,分别为“表示学习”和“聚类”。“表示学习”头在样本级别捕获对象的细粒度模式,作为“聚类”头的线索,提取粗粒度信息,将对象划分到对应的类簇中。整个模型以端到端的方式进行训练,通过最小化两个头部输出的两个对比损失的加权和。为了保证“聚类”头对应的对比损失是最优的,作者引入了一个新的评价函数,称为“点积对数(log-of-dot-product)”。

知识准备
  • 通过最大化不同视图之间的互信息进行表示学习
    由于难以直接计算互信息,通常使用最大化互信息的变分下界,本文采用了常用的下界InfoNCE:

    其中X\tilde{X}表示来自不同视图的随机变量。x_{1:M}是来自分布p_XM个样本,\tilde{x}是来自分布p_{\tilde{X}}x_1关联的样本。(\tilde{x}, x_1)为正例样本对,(\tilde{x}, x_i), (i=2,\cdots, M)为负例样本对。f(x, y)为实值函数用来评判xy之间的相似性。\mathcal{L}_{constrast}成为对比损失。
    由于
    小于等于0,因此I_{InfoNCE}(X, \tilde{X})以logM为上界。

  • 在实现中,f(\tilde{x},x_i)由缩放余弦相似度来计算:

    \tilde{z}z_i分别是\tilde{x}x_i的单位规范表示向量;即
    由此,(3)式中的对比损失可以被重写为
    FC表示“feature contrastive”。

聚类模块的对比损失
  • 通过最大化不同视图之间的互信息进行聚类
    使用聚类模块可以得到关于类簇的软分配表示q_i=(q_{i,1},\cdots,q_{i,C})C是类簇的个数。用于聚类的损失可表示为:
    \tilde{q}q_i分别是与\tilde{x}x_i相对应的概率向量。H是边际簇分配概率的熵,\tilde{q}_{avg}=
    这里最大化H(\tilde{Q}_{avg})是为了避免类簇分配的平凡解,即避免所有的样本都分配到同一个group中。
  • 关于相似性评判的函数选择
    本文指出,因为\mathcal{L}_{PC}应用于类别概率向量而不是连续的特征向量。因此,这里选用内积可能会造成次优解。理论上来说,最优的评判函数应该与logp(\tilde{x},x_i)成比例:
    \tilde{y}y_i\tilde{x}x_i对应的类簇标签。作者认为最适合的评价函数是
    即为摘要中提到的“点积对数”。当\tilde{q}q_i是同一one-hot向量时,该评价值达到最大值,当\tilde{q}q_i是不同的单热向量时,该值达到最小值。

除此之外,为了避免在最小化\mathcal{L}_{PC}过程中由于类簇分配概率接近于one-hot而导致的梯度饱和现象,我们将概率向量进行了如下的平滑:

其中r=(\frac{1}{C},\cdots,\frac{1}{C})是一个C维均匀分布向量,0 \leq \gamma \leq 1是给定的平滑系数,在实验中作者将其设置为0.01。

  • 对比概率损失的实现
    在实现中作者也是采用了两种不用的方式(SimCLR Framework and MemoryBank Framework)对\mathcal{L}_{PC}进行了实现。
    对于SimCLR Framework,\tilde{q}q_i(i \in \{1, \cdots, M\})由带参分类器s_\theta直接计算。、对于MemoryBank framework,则需要保持一个无参数的memory bank \mathcal{M},该矩阵是一个包含所有样本的类簇分配概率N \times C,其中的每一行的更新由如下方式计算:
    \alpha是一个动量系数,这里设置为0.5。q_{n,t}是训练样本x_nt时刻对应的概率向量,对应于\mathcal{M}矩阵中的第n行。\hat{q}_n=s_\theta(x_n)是当前新的概率向量。\mathcal{M}初始化为相同的概率(\frac{1}{C},\cdots,\frac{1}{C})
聚类模块和表示学习模块的结合(CRLC)

为了避免特征的表示学习模块导致的次优解。本文提出将对比聚类和表示学习统一到一个框架中称为CRLC。

如上图所示,C-head和RL-head共享相同的backbone网络框架。该框架通常采用卷积神经网络将输入图片x映射到隐含向量hh被喂入C-head和RL-head产生聚类分配向量q和连续的特征向量z。整个网络采用聚类损失和特征对比损失同时优化的方式进行训练:

semi-CLRC(variant of CRLC)

前面给出的模型CLRC是用于无监督聚类的,可以简单的将其拓展到半监督学习中。有标签数据可以有很多种方式应用在模型学习的过程中。这里,作者采用可最简单的方式进行拓展,即将有标签数据的交叉熵损失添加到原始的对比学习框架中。整体损失可以进行如下的表示:

作者通过实验说明了当只有少数标记样本可用时,CRLC-semi优于许多最先进的SSL方法。反正就是很优秀了。


实质上来讲,C-head和RL-head的区别在于一个将中间表示h映射为类簇的概率分配q,而另一个则是所谓的连续特征表示z。从构造上来讲,只是输出层的维数不一样,以及是否需要使用softmax进行激活(貌似稍微有点类似???但毕竟学习的参数不一样)。比起doubleClustering而言,相似性的评价函数在C-head中进行了改进,设置没有考虑纵向类簇在所有数据上的分布情况的对比,可能在实验中各有千秋吧。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,245评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,749评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,960评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,575评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,668评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,670评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,664评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,422评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,864评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,178评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,340评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,015评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,646评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,265评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,494评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,261评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,206评论 2 352

推荐阅读更多精彩内容