《Collaborative Filtering with Recurrent Neural Networks》简介

一、标题

Collaborative Filtering with Recurrent Neural Networks

二、来源

arXiv.org

三、问题

作者通过分析,认为传统推荐常用的协同过滤方法可以看作时间序列的预测问题。进而引入RNN这一处理序列问题常用的深度网络学习模型。

四、主要方法

4.1 RNNs(LSTM)

将数据集中出现的每个item视作一个词,item的集合视作词的集合。借用bag-of-words的思想,将每个item用one-hot向量表示。同时将每个用户的历史行为作为采样的时间序列。每一时刻, RNN模型的输入即为对应时刻item的one-hot编码表示,输出则为每个item对应神经元的softmax值的大小(所有用户行为中出现的item均有对应的softmax的输出)。可以根据问题需要返回softmax最大的前k个值作为推荐的item.
  这里,为了避免梯度消失的问题,文中采用"gated RNN"即LSTM.目标损失函数为item类别的交叉熵函数。一般形式为

  这里的ocorrect表示与实际时间序列输出item相对应的模型神经元的取值,如果该神经元的softmax符合前述要求(在最大的前k个值中),则将ocorrect记为1,否则则记为0.

4.2 Markov Chain

Markov Chain是时序预测中比较常见的方法。本文中,作者利用Markov Chain,将用户的行为中的item视为不同的state.不同state的转移概率表示用户从一个item转向下一个item的可能性的大小。推荐时返回转移概率最大的前k个item.

4.3 KNN(Userbased-CF)

基于user属性的协同过滤是传统的推荐方法之一。基于以下打分函数,给出top-N的结果。

  上式中ciu表示用户i与用户u的相似程度,文中相似程度是用余弦距离度量的。后面的示性函数表示该物品是否在用户u的历史行为中出现过。

4.4 BPR-MF

该方法是目前推荐领域先进的矩阵分解方法,在Mymedialite上有开发成熟的工具包。

五、相关工作

  • 提出将协同过滤视为序列预测问题的思想。
      作者提出,传统基于协同过滤的推荐方法,无论基于何种特征,都没有考虑用户历史行为的时间属性,只是将历史行为中的每个item统一考虑。这样处理带来的最大问题在于推荐系统无法分析用户喜好的变化情况,从而给出更符合用户现阶段喜好的推荐结果。那么,如果基于协同过滤“由过去,看未来”的思想,如果将该问题视作序列预测问题,一方面可以更好的分析用户的兴趣爱好的变化情况给出更好的推荐结果,另一方面也可以将在时序预测问题中广泛使用的RNN深度网络模型引入到推荐系统中。
  • 分析其他特征对推荐结果的影响
      前述RNN模型在输入时,只将item的one-hot属性作为输入信息。作者这里考虑将其他特征输入模型,比如用户的信息,item的属性,用户与item交互的信息等。作者这里将这些属性也用one-hot编码的形式表示,与之前的item向量拼接作为新的输入。下表是相关结果:



      从图中可以看出,引入新的特征对模型的提升作用并不明显,由此作者认为,时间序列已经包含大部分这里加入的信息,我们可以通过对时间序列的分析来隐含的利用信息。

六、简评

之所以选择这篇论文,一个重要原因在于自己考虑将RNN用在时间序列预测问题上,本篇论文提出的思路对自己是一个很好的启发。本篇论文的可贵之处不仅在于提出了看待协同过滤问题的新的角度,更在于他对模型参数进行了详细的分析,有利于具体的工程实践。但本文也存在一些瑕疵,比如就数据集本身而言,并不具备时序的信息,而且数据量是否可以减弱过拟合的影响,这些问题显得作者的结论说服力有待加强。再者处理RNN的输入时,作者只提到将item做one-hot编码,但不同时间序列可能属于不同用户,这一点对于RNN模型的训练影响,作者在训练时是否考虑这一因素文中也没有提及。总的说来,本篇论文提出的思想难能可贵,但具体到工程应用,还需要更多工作要做。
  以上都是本人自己的观点看法,肯定存在疏漏错误的地方,欢迎交流讨论。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,816评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,729评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,300评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,780评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,890评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,084评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,151评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,912评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,355评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,666评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,809评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,504评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,150评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,121评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,628评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,724评论 2 351

推荐阅读更多精彩内容