检测/分割的3篇无监督预训练工作：DenseCL; MaskContrast； InsLoc

https://hub.fastgit.org/lucidrains/pixel-level-contrastive-learning

1.DenseCL

Dense Contrastive Learning for Self-Supervised Visual Pre-Training

https://arxiv.org/abs/2011.09157 https://git.io/AdelaiDet

到目前为止，大多数现有的自监督学习方法都是针对图像分类而设计和优化的。由于图像级预测和像素级预测之间的差异，这些预先训练的模型对于密集预测任务可能是次优的。为了填补这一空白，我们设计了一种有效的、稠密的自监督学习方法，通过考虑局部特征之间的对应关系，直接在像素（或局部特征）水平上进行学习。本文提出了一种密集对比学习算法，该算法通过在像素级优化输入图像两视图间的成对对比（dis）相似性损失来实现自监督学习。与基线方法MoCo-v2相比，我们的方法引入了微不足道的计算开销（只慢了<1%），但在转移到下游密集预测任务（包括目标检测、语义分割和实例分割）时表现出了一贯的优越性能；并且大大超过了最先进的方法。具体来说，在强大的MoCo-v2基线上，我们的方法在PASCAL VOC对象检测上实现了2.0%的AP，在COCO对象检测上实现了1.1%的AP，在COCO实例分割上实现了0.9%的AP，在PASCAL VOC语义分割上实现了3.0%的mIoU，在Cityscapes语义分割上实现了1.8%的mIoU

2. MaskContrast（★★★★★）

在计算机视觉中，能够在无监督的情况下学习图像的稠密语义表示是一个重要的问题。然而，尽管这一问题具有重要意义，但除少数例外情况外，这一问题仍然没有得到很好的解决，即在小范围的数据集上进行无监督的语义分割。在本文中，我们首次尝试在传统上用于监督案例的数据集上解决这个问题。为了实现这一点，我们引入了一个新的两步框架，在对比优化目标中采用预先确定的先验知识来学习像素嵌入。这与依赖代理任务或端到端集群的现有工作有很大的不同。此外，我们还讨论了先验知识包含物体或其部分信息的重要性，并讨论了以无监督方式获得先验知识的几种可能性。大量的实验结果表明，该方法比现有的方法具有明显的优势。首先，利用K-Means将学习到的像素嵌入直接聚类到语义组中。第二，该方法可以作为语义切分任务的一种有效的无监督预训练方法。特别是，当在PASCAL上使用1%的标记示例对学习的表示进行微调时，我们的性能比有监督的ImageNet预训练好7.1%mIoU。

Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals

https://github.com/wvangansbeke/Unsupervised-Semantic-Segmentation

https://arxiv.org/pdf/2102.06191.pdf

3.Instance Localization for Self-supervised Detection Pretraining

本文的目的是发展专门用于目标检测的自监督式预训练模型，先前对自监督学习的研究已在图像分类上取得了长足的进步，但通常在目标检测上的迁移性能下降。本文的目的是发展专门用于目标检测的自监督式预训练模型。基于分类和检测之间的固有差异，我们提出了一种新的自监督的pretask任务，称为实例定位（instance localization）。图像实例粘贴在各个位置，并缩放到背景图像上。pretask 任务是在给定合成图像以及前景边界框的情况下预测实例类别。我们表明，将边界框集成到预训练中可以促进迁移学习的更好的任务对齐和体系结构对齐。另外，我们在边界框上提出了一种增强方法，以进一步增强特征对齐。结果，我们的模型在Imagenet语义分类上变得更弱，但是在图像patch定位上却变得更强，并且具有用于目标检测的整体更强大的预训练模型。

https://arxiv.org/abs/2102.08318

https://github.com/limbo0000/InstanceLoc

4.Propagate Yourself

Propagate Yourself: Exploring Pixel-Level Consistency for Unsupervised Visual Representation Learning

https://arxiv.org/abs/2011.10043

https://hub.fastgit.org/zdaxie/PixPro

https://hub.fastgit.org/lucidrains/pixel-level-contrastive-learning

非监督视觉表征学习的对比学习方法在迁移绩效上达到了显著水平。我们认为，对比学习的力量还没有完全释放出来，因为目前的方法只在实例级的借口任务上进行训练，导致表达对于需要密集像素预测的下游任务来说可能是次优的。在本文中，我们介绍了像素级的借口任务学习密集的特征表示。第一个任务是在像素级直接运用对比学习。此外，我们还提出了一个像素到传播一致性任务，该任务可以产生更好的结果，甚至大大超过最先进的方法。具体来说，通过2.6ap的ResNet-50骨干网，将其转换为Pascal VOC目标检测（C4）、COCO目标检测（FPN/C4）和Cityscapes语义分割，实现60.2ap、41.4/40.5map和77.2mou，0.8/1.0的mAP和1.0的mIoU优于以往建立在实例级对比学习基础上的最佳方法。此外，像素级的借口任务不仅对常规主干网络有效，而且对密集下游任务的头网络也有效，是实例级对比方法的补充。这些结果显示了在像素级定义借口任务的强大潜力，并为无监督视觉表征学习提供了一条新的途径。

5. Unsupervised Learning of Dense Visual Representations

https://arxiv.org/abs/2011.05499

对比自监督学习是一种很有前途的无监督视觉表征学习方法。通常，这些方法学习对同一图像的不同视图（即，数据增强的合成）不变的全局（图像级）表示。然而，许多视觉理解任务需要密集（像素级）表示。在本文中，我们提出了视图不可知稠密表示（VADeR）的稠密表示的无监督学习。维德通过强制局部特征在不同的观察条件下保持不变来学习像素表示。具体来说，这是通过像素级的对比学习来实现的：匹配特征（即在不同视图上描述场景相同位置的特征）应该在嵌入空间中靠近，而非匹配特征应该分开。VADeR为密集的预测任务提供了一种自然的表示方法，并能很好地转移到下游任务。在多个密集预测任务中，我们的方法优于ImageNet监督的预训练（和强无监督基线）。

最后编辑于：2021.03.30 17:05:58

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,240评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,328评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,182评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,121评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,135评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,093评论 1赞 295
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,013评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,854评论 0赞 273
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,295评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,513评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,678评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,398评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,989评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,636评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,801评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,657评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,558评论 2赞 352

检测/分割的3篇无监督预训练工作：DenseCL; MaskContrast； InsLoc

推荐阅读更多精彩内容