导读
准确来说,这篇Paper严格上算不上论文,没有什么贡献点。通篇说的就是Pinterest这APP的pipeline,如何利用各种特征进行图像检索。所以今天不打算详细的讲解,仅仅列举一些有趣的发现。
中低层特征效果更好。
如下图,文中做了大批量的实验,然后发现用中低层的特征表征图像时,效果更好。当取原始的raw特征时,ResNet-152的Pool5效果最好。并且当取二值化时,VGG16的FC-6层表现最好。然后作者发现一个有趣的现象,二值化时,ResNet-152的Pool5层效果大大下降。作者推测其原因是,Pool5层是对上一层的ReLu输出进行平均池化,而ReLu的输出是大于等于0的,对ReLu的激活值进行池化,会得到大于0的特征,而对这些特征进行二值化的时候,每个点都会变成1。
二值化提高AlexNet和VGG16在检索中的表现。
作者发现,对AlexNet和VGG16的特征进行二值化时,发现检索的效果提升了。
然后作者还发现,二值化更利于干净的分离噪声图像和真实图像,而raw特征却把他们聚类在一起。
最后贴一个Pipeline