新闻推荐(10):News Graph: An Enhanced Knowledge Graph for News Recommendation

前言

  • KaRS2019的一篇长文,主要介绍用于新闻推荐的知识图谱构建工作
  • 来自微软亚研和中科大的合作,相关工作见https://www.jianshu.com/p/4f0e6fa6ca30

  • 关键问题/背景:

    • 知识图谱包含丰富的知识信息和结构关系,对推荐很重要;
    • 然而当前推荐使用的都是通用KG,没有结合具体的任务
    • 因此这篇文章提出了针对新闻推荐构建的知识图谱,简称NG:
    1. 通用KG没有包含协同信息,如:被同一用户看过的不同新闻的实体之间存在关联(共现)
    2. 之前的研究也忽略新闻的主题信息,可以将主题信息加入图中,主题也是吸引用户阅读的重要信息;
    3. 过去的研究往往不加区分地使用通用KG资源,很多与内容无关/不重要的信息也被包含进来。
  • 针对上述分析,NG的主要工作是对应的三点:

  1. 构建协同关联边,定义三种协同关系(新闻共现,同一用户共现等)
  2. 利用新闻类别和LDA主题分布作为主题实体,加入图谱
  3. 提出一个搜索算法,剔除无关的实体。

模型方法

NG的简单示例如下:注意图中不同颜色的边,代表着不同关系

1. 剔除无关实体

算法如下:核心思想即对新闻内出现的每个实体进行关联搜索,在2跳的步数内计算相关边的权重(关系的重要程度),主要是找到新闻实体之间的可达路径,选取重要度TopN的关系,然后选取这些关系相关的三元组构成新的图谱

2. 利用协同关系

  1. 同一新闻中的实体存在关联
  2. 被同一用户点击过的实体存在关联; 文中举了一个例子:很多用户是五月天和周杰伦的双粉,然而通用KG中二者并非直接关联,通过这种协同关系NG可以充分利用这种潜在的关联。
  3. 出现在同一session的实体存在关联

3. 利用主题信息

新闻主题是吸引用户关注的重要因素。并非每篇新闻文章都包含知识实体。有时候用户点击文章仅仅是因为他们喜欢这些主题。为了填补文章中不包含知识实体或包含非信息实体的空白,文章利用新闻主题补充实体的信息。

考虑新闻文章的两种主题信息,即文章的显性主题和隐性主题。

作为编辑分类的文章类别标签是文章最好的明确的主题信息。然而,有时简单的分类信息可能不够全面,不足以代表文章的主题,特别是当文章没有分类标签的时候,所以还利用LDA主题模型来得到文章的隐含主题。

实验

MSN数据构建知识图谱,利用TransE对NG进行预训练得到节点和关系嵌入。
对于文章本身的内容信息,使用BERT等模型获取,最后文章的表示为实体信息和内容信息的融合:


Attentive Pooling

计算过程如下所示:

对比实验结果如下:

总结

本文针对新闻推荐这一特定领域,提出了一种构建知识图谱的方法,整合协同关系和主题信息,对提升推荐效果有重要帮助。

END

本人简书所有文章均为原创,欢迎转载,请注明文章出处 。百度和CSDN等站皆不可信,搜索请谨慎鉴别。技术类文章一般都有时效性,本人习惯不定期对自己的笔记/博文进行更新,因此请访问本人简书主页查看最新信息https://www.jianshu.com/u/40d14973d97c

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,869评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,716评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,223评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,047评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,089评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,839评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,516评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,410评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,920评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,052评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,179评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,868评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,522评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,070评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,186评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,487评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,162评论 2 356