上篇主要介绍了知识图谱在“搜索”中的落地,接下来继续介绍知识图谱在推荐中的落地。
[ 相关笔记 ]
2. 推荐
推荐系统的目的是推测用户的喜好,为用户推荐可能感兴趣的标的物,从而帮助用户节省时间,提升用户满意度。知识图谱在推荐系统上的落地主要在产品“策略层”,偏黑盒,因此,本部分只有“示例”,没有“实例”。主要分为三部分讲述:一是简要认识传统推荐系统;二是传统推荐系统的不足;三是知识图谱是如何落地在推荐系统上并优化这些不足的,细分为“特征”、“结构”、“可解释”和“语义”四大类。
2.1 传统推荐系统的主要类型
包括热门推荐、人工推荐、相关推荐、个性化推荐四大类。
a. 热门推荐:当下热点事件,具有广泛的社会关注,以达到“广而告之”的效果。例如知乎、新浪微博的“热榜”等;
b. 人工推荐:编辑或内容运营人员人工推荐的优秀内容/物品;
c. 相关推荐:根据当下浏览的内容按照一定的信息或关联规则进行的内容推荐,主要起“丰富扩展”的作用,例如看了“令人心动的offer”第二期,就会给你推荐第一期、第三期等;
d. 个性化推荐:根据用户的历史记录、实时行为以及个人偏好,通过算法和模型为用户自身定制化的推荐,已达到“想你所想”的效果。
前三种推荐是相对明确的,而个性化推荐是却是变化多样的。个性化推荐算法中以协同过滤为主流(包括基于用户的协同过滤和基于物品的协同过滤)
[ 基于用户的协同过滤 ] 以人推物,给用户推荐和他兴趣相似的其他用户喜欢的物品。M喜欢电影A,我和M在某些特征上相似,所以我也可能会喜欢电影A。
[ 基于物品的协同过滤 ] 以物推物,给用户推荐和他之前喜欢的物品相似的物品。我喜欢电影A,因为电影B与电影A在某些特征上相似,所以我也可能会喜欢电影B。
2.2 传统推荐系统的不足
a. 数据稀疏/长尾/噪音问题
在实际场景中,用户与用户、用户与物品的交互信息往往是比较稀疏的,用特别少的已观测数据来预测大量的未知信息,会极大增加算法的过拟合风险。例如,一个电影类APP可能包含上万部电影,而一个用户喜欢的电影可能平均只有几十部甚至更少。用几十部的数据来从几万部的电影里挑用户可能感兴趣的,可见推荐的准确率会如何。
b. 冷启动问题
对于新加入的用户或者物品,系统没有其历史交互信息,很难对其进行准确建模和推荐,相对应的推荐准确率和多样性也会大打折扣。
c. 个性化体验的可解释性
在现实生活中,我们为人提供推荐时如果能给出理由,会增加别人的认可度和接受度,互联网上的推荐系统也类似。一方面,如果我们在为用户推荐时能告诉用户推荐理由,一定程度能提升用户对推荐系统的信任度、接受度和满意度;另一方面,在一些高风险的行业,例如金融、医学、风控等,是必须要对算法模型具备解释能力的。但传统算法侧重输入和输出,中间的计算模型究竟学到了什么有效特征,使得它做出这样一个判断,这个过程是不透明的,缺乏可解释性。
2.3 知识图谱是如何解决的
2.3.1 有效利用图谱中的“特征”
[ 原理 ] 传统推荐主要考虑用户序列偏好,却忽视了细致的用户偏好,如用户具体喜欢某个物品的哪个属性等;而知识图谱提供了实体与实体之间更深层次、更长范围的关联,增强了推荐算法的挖掘能力,一定程度上提高了推荐的准确性和多样性,也有效地弥补交互信息的稀疏或缺失(冷启动)。
[ 示例 ] 传统推荐算法中物品属性可以看成是在知识图谱中和某物品直接相连的一跳(1-hop)的节点,即一个弱化版本的知识图谱,如图1,“少年的你”和“你的名字”之间。
而一个完整的知识图谱可以提供物品之间更深层次和更长范围内的关联。如图2,根据[少年的你]→[周冬雨]→[青春]→推荐出来[青春梦工厂],这条路径更深更长,可以挖掘更细粒度、深层次的信息,弥补了稀疏或缺失,也一定程度上提高了准确性;根据[少年的你]→[曾国祥],推荐同导演的[七月与安生]、根据[少年的你]→[周冬雨],推荐同主演的电影[后来的我们],一定程度上也提高了推荐的多样性。
2.3.2 有效利用图谱中的“结构”
[ 原理 ] 直接使用知识图谱的结构,获取每个实体在知识图谱中的多边关联实体,并从中得到推荐结果
[ 示例 ] 用户购买完某商品(实体)后还需要其他下游相关辅助物品或信息,例如买了笔记本有可能需要屏幕贴膜、耳机等,可以基于图谱中的下位实体遍历,推荐对应的配件。
2.3.3 有效利用图谱的“可解释”
[ 原理 ] 知识图谱是通过三元组(实体Entity、属性Attribute、关系Relation)来组织数据的,实体和实体之间是有效连接起来的,这使得解释成为可能。
[ 示例 ] 用户想看[七月与安生],系统根据[七月与安生]→[曾国祥]→[少年的你]、[七月与安生]→[周冬雨]→[少年的你]两条路径,为用户继续推荐了新上映的[少年的你],可以直接根据两条连接的路径为用户生成推荐理由:都由曾国祥导演,周冬雨主演。
2.3.4 有效利用图谱中的“语义”
[ 原理 ] 对于协同过滤计算出来的最邻近物品,系统推荐给用户,而对于该用户喜欢的物品在语义上相似的物品,同样推荐给用户。
[ 示例 ] TODO,只看到部分论文提到,还没搞清楚到具体示例。
[ Reference ]
1. 微软研究院AI头条 | 推荐算法不够精准?让知识图谱来解决
2. 微软研究院AI头条 | 可解释推荐系统:身怀绝技,一招击中用户心理
3. AI智见未来 | 浅析个性化推荐&知识图谱相结合
4. 产业智能官 | 肖仰华:基于知识图谱的可解释人工智能:机遇与挑战