揭开对比自监督学习的面纱：不变性、增强和数据集偏置

https://arxiv.org/abs/2007.13916v2

Demystifying Contrastive Self-Supervised Learning: Invariances, Augmentations and Dataset Biases

自监督表示学习方法最近在目标检测和图像分类等下游任务上超过了监督学习方法。有点神秘的是，最近性能的提高来自于训练实例分类模型，将每个图像及其增强版本视为单个类的样本。在这项工作中，我们首先提出定量实验来揭开这些成果的神秘面纱。我们证明了MOCO和PIRL等方法可以学习遮挡不变表示。然而，它们无法捕捉视点和类别实例的不变性，而视点和类别实例不变性是目标识别的关键组成部分。其次，我们证明了这些方法通过访问干净的以对象为中心的训练数据集（如Imagenet）获得了进一步的收益。最后，我们提出了一种利用非结构化视频来学习具有更高视点不变性的表示的方法。我们的结果表明，在编码不变性和下游图像分类和语义分割任务的性能方面，学习到的表示优于在相同数据上训练的MOCOv2。

1导言

受生物因素的启发和人工标注瓶颈的需要，人们对自我监督的视觉表征学习越来越感兴趣。自我监督学习的早期工作侧重于使用“借口”任务，这些任务的基本真相是免费的，可以通过自动化过程获得[3,4]。大多数借口任务包括预测输入数据的某些隐藏部分（例如，预测未来帧[5]或灰度图像的颜色[6]）。然而，学习表征的表现与受监督的表现相差甚远。

过去六个月在自我监督学习领域是革命性的。最近的几项研究[2,1,5,7,8]报告了自我监督学习性能的显著改善，现在超越监督学习似乎已成定局。那么，什么发生了巨大的变化？近期作品的共同主题是关注实例识别任务[9]——将每个实例视为自己的一个类。图像及其增强是这一类的积极例子；所有其他图像均被视为负片。对比损失[5，7]已被证明是一个有用的目标函数，例如判别，但需要收集属于同一类别（或本例中的实例）的成对样本。为了实现这一点，最近的所有作品都采用了“积极”的数据扩充策略，其中可以从单个图像生成大量样本。实例辨别、对比损失和积极增强是这些新收益背后的三个关键因素。

虽然据报道在物体识别任务方面取得了巨大的进步，但这些进步背后的原因仍不清楚。我们的工作试图揭开这些成就的神秘面纱，揭开这一成功背后隐藏的故事。视觉表现的效用可以通过研究其编码的不变性（定义见第4.1节）来理解。首先，我们确定对目标识别任务至关重要的不同不变性，然后评估两种最先进的对比自监督方法[1,2]与它们的监督对应方法。我们的结果表明，最近的大部分收益来自于遮挡不变性。遮挡不变性是积极的数据增强的一个明显副产品，这种数据增强包括裁剪图像的一小部分，并将其视为与完整图像属于同一类别。当涉及到视点和类别实例不变性时，监督方法和自监督方法之间仍然存在差距。

遮挡不变性是有用表示的一个关键属性，但是人工裁剪图像是实现这一点的正确方法吗？对比损失明确鼓励最小化正对之间的特征距离。在这种情况下，该对将由图像的两个可能不重叠的裁剪区域组成。例如，在室内场景图像的情况下，一个样本可以描绘椅子，另一个样本可以描绘桌子。在这里，代表性将被迫在区分这些椅子和桌子时表现不佳——直觉上这是错误的目标！那么这些方法为什么有效呢？我们假设两个可能的原因：（a）预训练数据集——Imagenet的潜在偏差是一个以对象为中心的数据集，它确保不同的作物对应于同一对象的不同部分(b）表示函数不够强，无法实现这一错误目标，导致出现了一种在实践中效果良好的次优表示。我们通过诊断实验证明，这些方法的成功确实源于训练数据集的以对象为中心的偏见。这表明，在未来的工作中，必须重新考虑和改进采用积极的合成增强的想法，以确保可扩展性。

作为朝着这个方向迈出的一步，在本文中，我们主张在实例识别任务中使用更自然的数据形式：视频。我们提供了一种利用视频中自然发生的转换来学习表示的简单方法。我们证明，与基于图像的学习相比，利用这种形式的数据可以获得更高的视点不变性。我们还表明，学习后的表示在视点不变性、类别实例不变性、遮挡不变性方面优于在相同数据上训练的MoCo-v2[10]，并且在对象识别任务上也显示了改进的性能。

图1：侵略性增强收缩自监督学习方法采用侵略性裁剪策略生成正对。通过此策略，图像（左）产生许多非重叠作物（右）作为样本。我们可以观察到，作物不一定描绘同一类别的物体。因此，匹配这些作物特征的表示将不利于下游对象识别任务。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,509评论 6赞 504
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,806评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,875评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,441评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,488评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,365评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,190评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,062评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,500评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,706评论 3赞 335
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,834评论 1赞 347
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,559评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,167评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,779评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,912评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,958评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,779评论 2赞 354

揭开对比自监督学习的面纱：不变性、增强和数据集偏置

推荐阅读更多精彩内容