2019-06-20

 推荐系统论文阅读(一)利用用户和物品的分层结构

论文

Exploring Hierarchical Structures for Recommender Systems

背景

补全"用户——物品"的评分矩阵(如下图所示), 从而能够凭借评分矩阵进行物品的推荐.

   图一

基础模型

加权的非负矩阵分解weighted nonnegative matrix factorization (WNMF), 公式如下图所示(W是一个指示矩阵, 元素为0表示缺失值, 元素为1表示未缺失):


图二

动机

商品(或者用户)存在自身的层次结构, 相同层次结构的商品(或者用户)共享相似的特征. 如果将先验的层次信息加入到模型中将会提高预测精度.例如: 音乐可以分为 古典音乐, 爵士音乐, 乡土音乐等等, 爵士音乐又可以分为经典的爵士音乐等等, 如下图所示(可以看出本文的层次结构主要是指一种树形的分层结构):


图三

难点

如何将结构信息建模, 主要分为 在显示的情况下(告诉你分类信息), 在隐式的情况下.(结构信息未知).

本文提出的模型

The Proposed IHSR

隐式情况下, 建模层次结构, 公式如下:


图四

核心思想: 深度的矩阵分解, 将原先的物品矩阵(用户矩阵)进一步向下分解, 相当于将物品不断地归类.模型的概述如下图所示:


图五

例如: 

将原先 d\times m 维的V矩阵分解为 d\times  m1维的V2矩阵和 m1\times m的V1矩阵, 表示将原先的m个物品归类为m1类, 每个类用d维向量表示, V1矩阵则表示着m个样本与m1个类别之间的映射关系, 可以看成表示哪些样本属于哪些类别.

The Proposed HSR

首先定义Q矩阵:

图六

如上图所示, 如果已知物品(或者用户)的类别先验信息, 那么对于v1~v8八个物品, 就可以不断地将物品进行归类. 最下面一层是最初的叶子节点表示着这八件物品, 接下来可以归类成为上一层的4个类别, 最终归类成为最上层的2个类别.

定义Q2矩阵为 4x2 的矩阵:

图七

Q2矩阵表示着第一层与第二层之间的关系(从上往下看).  第(1, 1)的元素为1, 表示第一个子类属于第一个父类; (2, 1)元素为1, 表示第二个子类属于第一个父类;  (3, 2)元素为1, 表示第三个子类属于第二个父类; (4, 2)元素为1, 表示第四个子类属于第二个父类. 可以看出Q矩阵是一种子类与父类关系的表示矩阵, 因此可以通过一系列Q矩阵表示各个层次的关系.

接着, 显式情况下建模, 公式如下:


相较于IHSR模型, HSR模型多了两个正则化项, 核心思想是: 父类别捕捉更广泛的特征, 子类别捕捉细粒度的特征, 所以父类别的特征表示与子类别特征表示的均值应该是近似的. 

例如

式1

代表着父类的特征表示


式2

代表着子类的特征表示,.

首先对Q矩阵进行归一化操作, 那么 式2与Q矩阵相乘就相当于将子类映射成为父类, 并对每个类别取了均值.

注意项

因为层次结构是固定的, 比如一类物品可以不断地分成3类, 而另一类物品只能分成两个类别, 那么就如下处理, 即加上一个虚拟的类别(结点):


图八

预训练

下图是本文模型的伪代码, 可以看出(第2, 4, 6步), 本文模型需要进行预训练, 最终进行求解. 感觉像是深度神经网络中的预训练过程。。。

实验

本文做了很多可视化实验, 值得学习. 主要分为IHSR和HSR模型的效果, 模型的参数灵敏度分析等等.

思考

看了一些矩阵分解的模型, 第一次看到这种深度矩阵分解的模型, 感觉很新鲜, 同时用在了推荐系统上, 有着很好的解释性. 同时感觉深度这个思想在很多方面都有着相应的发展, 深度神经网络的兴起也带动了其他模型的发展. 不过, 本文的模型只是捕捉树形结构的分层信息, 应该存在改进空间.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 224,467评论 6 522
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 96,079评论 3 402
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 171,600评论 0 366
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 60,835评论 1 300
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 69,848评论 6 399
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 53,348评论 1 314
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 41,735评论 3 428
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 40,705评论 0 279
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 47,238评论 1 324
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 39,268评论 3 345
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 41,395评论 1 354
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 37,012评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,704评论 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 33,177评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 34,309评论 1 275
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,925评论 3 381
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 46,457评论 2 365

推荐阅读更多精彩内容

  • 机器学习术语表 本术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。 A A/B 测试 (...
    yalesaleng阅读 1,975评论 0 11
  • 中国文化博大精深,为了更好地正确理解划分词类的依据或标准,我们学习了词类划分,利于我们记住各类词的用法,避免词类的...
    小熊在冬夜阅读 192评论 0 2
  • 好了,到了开课的时间了,我感觉我去了外太空周游了一场,刚刚回来,所以也想把这种梦幻的感觉,送给大家,希望这种特殊...
    阳光森林依依美人团宣好阅读 565评论 0 1
  • 20180922 闫安 受邀参与中国社科院《2018社会保障绿皮书》的相应章节。...
    闫安阅读 2,897评论 0 2
  • 我读的书是皮皮鲁之保卫叛逆者,好段,她突然想哭。不知道为什么,他往常那么讨厌学校,可现在一想到自己将永远离开学校,...
    李嘉荣321阅读 202评论 0 0