姓名:毕晓鹏
学号:19021210824
【嵌牛导读】这是一篇关于电商检索的论文,讲了如何淘宝如何通过用户上传的图片,返回相关商品
【嵌牛鼻子】商品检索
【嵌牛提问】你知道更多的电商检索方法吗?
【嵌牛正文】
难点
用户上传的数据带有复杂的背景,图像质量不一样。
商品数量大,类别之间差异小。
标注训练,清洗数据成本高。
不仅要使用视觉搜索技术返回商品,还要考虑商品的质量,用户的购买意愿。
基于分类模型和图像搜索融合的类目预测
类目预测是为了进一步减小搜索空间
基于分类模型的商品类别预测,训练googlenetV1 预测查询图像的类别(14个大类),使用softmax分类函数,每一个类别都对应着一个概率。
基于图像搜索技术的商品类目预测,使用googlenetv1输出的特征,在整个图像库里面检索最相似的top30图像,对这30幅图像类别加权排序,同样每个类别对应一个相应的概率。
将上述两种方法进行融合,加权平均,得到最终的可能商品类别,上述融合方法取得了2%top1的精度提升。
构建难样本
使用triplet loss作为损失函数,负样本的选择,直接用其他类目的图像,并不是最优选择,通过挖掘用户的点击行为,使用用户点击图像和非点击图像作为正负样本。
联合目标检测
对目标进行裁剪,会去掉很多背景信息,来优化检索性能。如果使用目标检测算法,会造成时间开销增大,阿里提出了一种联合学习的方法。这里的目标检测分支并没有标注目标框的监督信息,这里具体网络怎么找到的目标信息,还需要再看一下。
重排序
对于视觉搜索返回的商品列表结果,精确的结果并不能很好的激发用户点击商品,所以会根据每个商品的价格、好评等其他信息排序。
图像索引和检索
为了提高检索速度,先使用二值进行查询,这里为了过滤大部分未匹配的数据,然后在进行细排序,最后根据重排序来最终确定返回的商品。