推荐系统中引入 embedding , 分为两大流派:
有监督学习,end-to-end。embedding作为优化变量,随机初始化,在优化最终logloss的过程中,得到有意义的embedding作为“副产品”。个人感觉,这一流派是主流,Youtube对video_id、Wide&Deep对app_id、Deep Interest Network对商品id的embedding都是这一思路。
无监督学习,两步走。以Item2vec: Neural Item Embedding for Collaborative Filtering为代表。第一步,就是简单套用word2vec的思路,在电商场景,就将word2vec中的句子换成购物车,将单词换成商品;新闻推荐场景中,将句子换成session,将单词换成文章。再直接调word2vec算法,就得到商品、文章的embedding向量。第二步,这些embedding向量,可以用于召回,可以用于第一类方法的embedding矩阵的初值,也可以当特征喂入其他模型。感觉这类方法近年来遇冷,不怎么受关注 , Airbnb的这篇文章算是对第二类方法的一次复兴
#论文笔记#Real-time Personalization using Embeddings for Search Ranking at Airbnb
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 背景介绍 论文《Real-time Personalization using Embeddings for Se...
- 这篇论文主要就是讲了如何对id类特征进行embedding操作,Airbnb结合word2vec模型预训练了2...
- 提纲 解决的问题 方法 实验 疑问与启发 1.解决的问题 本文要解决两个问题: 针对短租市场,大部分的用户很少会多...
- 本文代码 Embedding(嵌入)在数学上表示一个maping, f: X -> Y, 也就是一个functio...
- 前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。这篇文章,甚至之后...