产品 | 知识图谱落地应用:推荐

上篇主要介绍了知识图谱在“搜索”中的落地,接下来继续介绍知识图谱在推荐中的落地。

[ 相关笔记 ]

产品 | 知识图谱落地应用:搜索

产品 | 知识图谱落地应用:智能问答

产品 | 知识图谱落地应用:金融投资领域

2. 推荐

推荐系统的目的是推测用户的喜好,为用户推荐可能感兴趣的标的物,从而帮助用户节省时间,提升用户满意度。知识图谱在推荐系统上的落地主要在产品“策略层”,偏黑盒,因此,本部分只有“示例”,没有“实例”。主要分为三部分讲述:一是简要认识传统推荐系统;二是传统推荐系统的不足;三是知识图谱是如何落地在推荐系统上并优化这些不足的,细分为“特征”、“结构”、“可解释”和“语义”四大类。

2.1 传统推荐系统的主要类型

包括热门推荐、人工推荐、相关推荐、个性化推荐四大类。

a. 热门推荐:当下热点事件,具有广泛的社会关注,以达到“广而告之”的效果。例如知乎、新浪微博的“热榜”等;

b. 人工推荐:编辑或内容运营人员人工推荐的优秀内容/物品;

c. 相关推荐:根据当下浏览的内容按照一定的信息或关联规则进行的内容推荐,主要起“丰富扩展”的作用,例如看了“令人心动的offer”第二期,就会给你推荐第一期、第三期等;

d. 个性化推荐:根据用户的历史记录、实时行为以及个人偏好,通过算法和模型为用户自身定制化的推荐,已达到“想你所想”的效果。

前三种推荐是相对明确的,而个性化推荐是却是变化多样的。个性化推荐算法中以协同过滤为主流(包括基于用户的协同过滤和基于物品的协同过滤)

[ 基于用户的协同过滤 ] 以人推物,给用户推荐和他兴趣相似的其他用户喜欢的物品。M喜欢电影A,我和M在某些特征上相似,所以我也可能会喜欢电影A。

[ 基于物品的协同过滤 ] 以物推物,给用户推荐和他之前喜欢的物品相似的物品。我喜欢电影A,因为电影B与电影A在某些特征上相似,所以我也可能会喜欢电影B。

2.2 传统推荐系统的不足

a. 数据稀疏/长尾/噪音问题

在实际场景中,用户与用户、用户与物品的交互信息往往是比较稀疏的,用特别少的已观测数据来预测大量的未知信息,会极大增加算法的过拟合风险。例如,一个电影类APP可能包含上万部电影,而一个用户喜欢的电影可能平均只有几十部甚至更少。用几十部的数据来从几万部的电影里挑用户可能感兴趣的,可见推荐的准确率会如何。

b. 冷启动问题

对于新加入的用户或者物品,系统没有其历史交互信息,很难对其进行准确建模和推荐,相对应的推荐准确率和多样性也会大打折扣。

c. 个性化体验的可解释性

在现实生活中,我们为人提供推荐时如果能给出理由,会增加别人的认可度和接受度,互联网上的推荐系统也类似。一方面,如果我们在为用户推荐时能告诉用户推荐理由,一定程度能提升用户对推荐系统的信任度、接受度和满意度;另一方面,在一些高风险的行业,例如金融、医学、风控等,是必须要对算法模型具备解释能力的。但传统算法侧重输入和输出,中间的计算模型究竟学到了什么有效特征,使得它做出这样一个判断,这个过程是不透明的,缺乏可解释性。

2.3 知识图谱是如何解决的

2.3.1  有效利用图谱中的“特征”

[ 原理 ] 传统推荐主要考虑用户序列偏好,却忽视了细致的用户偏好,如用户具体喜欢某个物品的哪个属性等;而知识图谱提供了实体与实体之间更深层次、更长范围的关联,增强了推荐算法的挖掘能力,一定程度上提高了推荐的准确性和多样性,也有效地弥补交互信息的稀疏或缺失(冷启动)。

[ 示例 ] 传统推荐算法中物品属性可以看成是在知识图谱中和某物品直接相连的一跳(1-hop)的节点,即一个弱化版本的知识图谱,如图1,“少年的你”和“你的名字”之间。

而一个完整的知识图谱可以提供物品之间更深层次和更长范围内的关联。如图2,根据[少年的你]→[周冬雨]→[青春]→推荐出来[青春梦工厂],这条路径更深更长,可以挖掘更细粒度、深层次的信息,弥补了稀疏或缺失,也一定程度上提高了准确性;根据[少年的你]→[曾国祥],推荐同导演的[七月与安生]、根据[少年的你]→[周冬雨],推荐同主演的电影[后来的我们],一定程度上也提高了推荐的多样性。

2.3.2  有效利用图谱中的“结构”

[ 原理 ] 直接使用知识图谱的结构,获取每个实体在知识图谱中的多边关联实体,并从中得到推荐结果

[ 示例 ] 用户购买完某商品(实体)后还需要其他下游相关辅助物品或信息,例如买了笔记本有可能需要屏幕贴膜、耳机等,可以基于图谱中的下位实体遍历,推荐对应的配件。

2.3.3 有效利用图谱的“可解释”

[ 原理 ] 知识图谱是通过三元组(实体Entity、属性Attribute、关系Relation)来组织数据的,实体和实体之间是有效连接起来的,这使得解释成为可能。

[ 示例 ] 用户想看[七月与安生],系统根据[七月与安生]→[曾国祥]→[少年的你]、[七月与安生]→[周冬雨]→[少年的你]两条路径,为用户继续推荐了新上映的[少年的你],可以直接根据两条连接的路径为用户生成推荐理由:都由曾国祥导演,周冬雨主演。

2.3.4 有效利用图谱中的“语义”

[ 原理 ] 对于协同过滤计算出来的最邻近物品,系统推荐给用户,而对于该用户喜欢的物品在语义上相似的物品,同样推荐给用户。

[ 示例 ] TODO,只看到部分论文提到,还没搞清楚到具体示例。

[ Reference ]

1. 微软研究院AI头条 | 推荐算法不够精准?让知识图谱来解决

2. 微软研究院AI头条 | 可解释推荐系统:身怀绝技,一招击中用户心理

3. AI智见未来 | 浅析个性化推荐&知识图谱相结合

4. 产业智能官 | 肖仰华:基于知识图谱的可解释人工智能:机遇与挑战

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352

推荐阅读更多精彩内容

  • 本文首发于个人博客,可 点击查看 推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”。-- Fro...
    阿拉灯神丁Vicky阅读 2,464评论 0 18
  • 1. 好的推荐系统 什么是推荐系统? 在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者...
    Wang66阅读 487评论 0 4
  • 作者:项亮出版日期:2012.06 随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这...
    新星_点灯阅读 1,633评论 0 15
  • 知识图谱(Knowledge Graph)是当前学术界和企业界的研究热点。中文知识图谱的构建对中文信息处理和中文信...
    苟雨阅读 7,323评论 0 11
  • 害怕孤独,成为了很多人的标签。越长大越孤单,同时也说出了多数人的心声。清晨的早上,我独自一人走出家门,四周人潮涌动...
    拉萨小惠阅读 176评论 0 1