【AE based RS】Deep Collaborative Filtering via Marginalized Denoising Auto-encoder

  • ACM 15
  • 美国东北大学

abstract

协同过滤(CF)已广泛用于推荐系统中以解决许多现实问题。学习有效的潜在因子在协同过滤中起着最重要的作用。基于矩阵分解技术的传统CF方法从 user-item 评级中学习潜在因子,遭受冷启动问题以及稀疏性问题。一些改进的CF方法通过将边信息合并为正则化来丰富潜在因子的先验。然而,由于评级和边信息的稀疏性质,所学习的潜在因子可能不是非常有效。为了解决这个问题,我们通过深度学习学习有效的潜在表示。我们通过将矩阵分解与深度特征学习相结合,提出了CF的一般化的深度体系结构。我们通过将概率矩阵分解与边缘化去噪堆叠自动编码器相结合,提供我们架构的自然实例。

在本文中,我们提出了一种协同过滤的深度学习模型,它将基于矩阵分解的协同过滤与深度学习算法紧密结合,即边缘化去噪自动编码器(mDA)[16]。与 CDL 集成了协同主题回归和贝叶斯堆叠去噪自动编码器并且需要使用EM样式算法学习大量超参数不同,我们的方法使用基于mDA和随机梯度下降的更高效的架构,因此计算效率高,可扩展性高。

主要工作

  • 我们提出了一种称为深度协同过滤(DCF)的通用深度体系结构,它集成了矩阵分解和深度特征学习。 它建模了CF中使用的潜在因子与深度模型中的潜在层之间的映射。
  • 通过利用概率矩阵分解和mDA,我们提出了上述体系结构的实例化(即mDA-CF和mSDACF)。 mDA的可扩展性和低计算成本使其成为极具吸引力的深度学习工具。
  • 我们评估了我们模型在三个真实世界应用,电影推荐,书籍推荐和响应预测方面的表现。 我们的模型优于传统的CF方法。

相关工作

Matrix Factorization for Collaborative Filtering

矩阵分解(MF)是最常用的衍生潜在因子模型的技术,它们在Netflix竞赛中的成功突出了它们的优势。例如,由用户的项目偏好组成的给定矩阵X∈RN×M可以被分解为两个低维矩阵U和V的乘积。分解可以通过各种方法进行,从基于SVD的方法[19]到相对较新的非负矩阵分解方法[20]。一种经典的MF方法是概率矩阵分解(PMF)。该方法背后的基本假设是潜在因子的先验概率分布和给定潜在因子的观察评级的概率遵循高斯分布。目前,已经开发了许多算法来增强PMF的性能,通过设计贝叶斯版本[21,22,23],或者结合辅助信息,例如社交关系[24,5,25]。虽然有希望,但矩阵分解方法存在冷启动问题,即当新用户/物品到达系统时要做出什么建议。在许多现实世界的应用中经常出现的另一个问题是数据稀疏性或降低的覆盖范围。 Porteous等人。提出了一种带有边信息和Dirichlet过程混合的贝叶斯矩阵分解(BMF)方法[26]。在[27]和[28]中也分别提出了变分BMF方法和利用边信息的分层BMF方法。胡等人。提出了一种跨域三元分解(CDTF)方法[29],它利用了来自其他领域的信息。提出上述方法用于解决推荐问题。最近,基于MF的协同过滤也应用于响应预测[30,31]。上述方法可以缓解冷启动和数据稀疏的问题,但是当辅助信息稀疏时可能仍然会受到影响。学习有效特征在矩阵分解中至关重要。最近,基于深度学习的方法已经成为学习表示的有力工具,并且广泛用于从计算机视觉到语音识别和机器翻译的许多应用中。在本文中,我们的目标是将基于深度学习的方法与矩阵分解相结合,进行协同过滤。在下一小节中,我们调查了基于深度学习的协同过滤方法的应用。

Deep Learning for Collaborative Filtering

深度学习模型在协同过滤任务中的应用是非常新的,并且在这方面没有太多尝试。 Salakhutdinov等。 [10]是第一个将深度学习应用于协同过滤任务的人。他们将受限制的Boltzmann机器修改为两层无向图形模型,由二元隐藏单元和softmax可见单元组成,用于协同过滤任务。他们设计了一种称为对比发散(CD)的有效学习程序,以最大化真实似然函数的近似值。他们还提出了条件RBM模型和推理程序。他们在Netflix数据集上测试了模型的性能以进行电影推荐,并表明他们的模型与基线方法相比表现良好。
特鲁伊恩等人。 [14]提出了用于协同过滤的序数Boltzmann机器。他们研究了用于处理评级的序数性质的参数化,并介绍了多个Boltzmann机器的集成,用于基于用户和基于项目的过程。
最近,一些深度学习模型从内容信息中学习潜在因素,如音频或文章的原始特征[32,33]。王等人。 [12]利用深度信念网(DBN)进行音乐推荐,在联合框架中统一了歌曲的特征提取和推荐。他们假设用户具有从高斯先验绘制的特征向量βu并且歌曲具有特征向量xv。他们使用深度信念网络自动学习歌曲的特征向量,这是一个具有隐藏节点和观察的生成概率图形模型。它有数百万个参数可以从训练数据中学习。作者使用Restricted Boltzmann机器的堆叠层以无监督的方式进行预训练,然后使用最大似然估计(MLE)进行监督学习。
Oord等人。 [13]使用卷积神经网络解决了音乐推荐问题。他们首先进行加权矩阵分解以处理隐式反馈并获得所有歌曲的潜在因素。之后,他们使用深度学习将音频内容映射到那些潜在因素。特别是,他们从音频信号中提取局部特征,并将它们聚合成一个词袋表示。最后,采用深度卷积网络将该特征表示映射到潜在因子。他们在Million歌曲数据集上测试了他们的算法,并表明他们的模型通过增加音频信号来改善推荐性能。所有前面提到的方法主要修改用于协同过滤任务的深度学习算法,并且不直接将矩阵分解与深度学习模型耦合。
最近,Wang等人。 [15]提出了一种称为协作深度学习(CDL)的分层贝叶斯模型,它紧密耦合堆叠去噪自动编码器(SDA)和协同主题回归(CTR)。这项工作与我们的工作最接近,但与我们的工作有很多重要方面不同,如下 - (i)CDL采用了贝叶斯SDA的表述。 CDL的生成过程包括用于CDL的绘制样本,使用EM样式算法来获得贝叶斯SDA的MAP估计,因此它必须学习大量参数。我们的模型采用更高效的架构,边缘化SDA(mSDA),以封闭形式计算参数,因此高效且可扩展。 (ii)CDL仅提取物品的深层特征,而我们的模型为物品和用户学习深层特征。

PRELIMINARIES

矩阵分解(MF)是最有效的协同过滤方法。 它允许我们通过将交互矩阵分解为用户和项目特征的联合潜在空间来发现用户项目交互的潜在因素。 它通过将由m个用户对n个项目的评级组成的原始评级矩阵R∈Rm×n分解为两个低秩矩阵U∈Rm×d和V∈Rn×d,分别由用户和项目特征组成的等级d进行分解。


Deep Collaborative Filtering (DCF)

在本节中,我们介绍了提出的深度协同过滤(DCF)框架,该框架将深度学习模型与基于MF的协同过滤相结合。 图1说明了我们的DCF框架的想法。 DCF是一种混合模型,它利用评级矩阵和辅助信息,并将矩阵分解和特征学习结合在一起。
给定user-item评级矩阵R,用户侧信息X和项目侧信息Y,DCF共同分解R并且通过评级和边信息(即,X和Y)来学习潜在因子(即,U,V)。





未完待续。。。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352