1、摘要
协同过滤方法由于user-item矩阵的稀疏性,效果受限。可以使用辅助信息解决这个问题。在本文中,微软探索了如何利用知识库中的各种不同的信息去提升推荐系统的performance。 首先,为了使用知识库,我们设计了三个组件分别从物品的结构化内容,文本内容和视觉内容中提取语义特征。更确切的说,网络TransR提取物品的结构化信息(同时考虑nodes和relationships)。stacked denoising auto-encoders提取文本表达。stacked convolutional auto-encoders提取物品视觉表达。最后我们提出整合的框架:Collaborative Knowledge Base Embedding(CKE)来联合学习协同过滤的隐式向量以及物品的基于知识库的语义表达。
2、本文贡献
(1)据我们所知,这是首次利用来自知识库的结构性内容,文字内容和视觉内容用于推荐系统。
(2)我们采用包括异构网络嵌入和深度学习嵌入的两种嵌入方法自动从知识中提取语义表示。
(3)通过执行知识库嵌入和协作联合过滤,CKE可以同时从知识库中提取特征并且表示获取隐式的用户和项目之间的关系。
(4)基于两个实词数据集,我们进行了广泛的评估我们框架有效性的实验。结果表明,我们的方法显着优于基准方法。
3、KNOWLEDGE BASE EMBEDDING
【1】Structural Embedding
采用TransR的方法,与其他embedding的方式相比,TransR通过关系矩阵来链接不同语义空间。如下图所示,实体与关系存在于不同的空间,而TransR通过矩阵M将实体从实体空间转到关系空间,并在关系空间中进行进行计算。
计算方法为
具体过程为
【2】Textual Embedding
采用SDAE的方法
【3】Visual Embedding
采用SCAE的方法,SCAE和SDAE需要参考另外的论文,没仔细看,以后再补充,这里先罗列一下公式
4、联合学习
为了将协作过滤与知识库中item的嵌入表示结合起来,我们提出了CKE.采用pair-wise ranking的方法,user的向量不变,item的变为
这样,训练过程如下:
综合上述的一些策略,并且加入了一些其他的目标函数(这里有些没看懂哪来的)。采用最大化后验概率的方法,优化目标为
5、实验部分
数据集采用MovieLens-1M,IntentBooks
评价指标采用MAP,Recall@K(K=20-100)