[论文笔记]Visual Discovery at Pinterest

导读
准确来说,这篇Paper严格上算不上论文,没有什么贡献点。通篇说的就是Pinterest这APP的pipeline,如何利用各种特征进行图像检索。所以今天不打算详细的讲解,仅仅列举一些有趣的发现。

中低层特征效果更好。

如下图,文中做了大批量的实验,然后发现用中低层的特征表征图像时,效果更好。当取原始的raw特征时,ResNet-152的Pool5效果最好。并且当取二值化时,VGG16的FC-6层表现最好。然后作者发现一个有趣的现象,二值化时,ResNet-152的Pool5层效果大大下降。作者推测其原因是,Pool5层是对上一层的ReLu输出进行平均池化,而ReLu的输出是大于等于0的,对ReLu的激活值进行池化,会得到大于0的特征,而对这些特征进行二值化的时候,每个点都会变成1。


特征层选取
二值化提高AlexNet和VGG16在检索中的表现。

作者发现,对AlexNet和VGG16的特征进行二值化时,发现检索的效果提升了。


VGG16二值化

然后作者还发现,二值化更利于干净的分离噪声图像和真实图像,而raw特征却把他们聚类在一起。


二值化

最后贴一个Pipeline


image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容