Neil Zhu,简书ID Not_GOD,University AI 创始人 & Chief Scientist,致力于推进世界人工智能化进程。制定并实施 UAI 中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。
作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团), DL Center(深度学习知识中心全球价值网络),AI growth(行业智库培训)等,为中国的人工智能人才建设输送了大量的血液和养分。此外,他还参与或者举办过各类国际性的人工智能峰会和活动,产生了巨大的影响力,书写了60万字的人工智能精品技术内容,生产翻译了全球第一本深度学习入门书《神经网络与深度学习》,生产的内容被大量的专业垂直公众号和媒体转载与连载。曾经受邀为国内顶尖大学制定人工智能学习规划和教授人工智能前沿课程,均受学生和老师好评。
内容来自Netflix员工Xavier Amatriain的lecture slides,相当犀利的推荐系统参考
混合的策略
- 带权重的方式:来自不同技术的结果(以分数或者计票的)以不同的程度的重要性进行整合来提供最终的推荐
- 切换:取决于场景,系统提供从一个技术切换到另一个技术
- 混合:从不同技术获得的推荐最终被放在一起进行推荐
- 特征的整合:来自不同推荐源的特征组合给一种技术使用
- 瀑布式:一种技术的输出作为另一种技术的输入最终获得的结果作为推荐
- 特征的增广:一种技术的输出作为另一种技术的输入特征
- 元层:由一个推荐器学习的模型用作另一个推荐器的输入
带权重的方式
将不同的推荐技术获得的结果整合进一个单一的推荐列表:
- 推荐打分的线性组合
- 将每个推荐器的输出作为一个投票的集合,接着使用人口普查的方式进行整合
假设:不同技术的相对价值是可能物品空间的均匀分布
但是这个假设不一定正确:例如Collaborative推荐器可能对那些有较少评论者的物品没有很好的效果
切换
这种系统采取策略在不同技术之间进行转换
例子,DailyLearner系统使用一个基于内容的collaborative混合的方式,其中基于内容的推荐方法是优先使用的。如果基于内容的系统不能够给出一个充分可信的推荐结果,那么使用collaborative的推荐就接替了。需要注意的是,切换不是完全避免冷启动问题,因为协同的和基于内容的系统同样有新用户问题
最为困难的地方是确定好的切换条件。
混合的方式
从超过一个技术产生的推荐被一起被推荐
混合策略可以避免新物品的开始问题
但是还会收到新用户的开始问题,因为内容和协同方法需要用户的偏好来开始
特征的组合
特征可以从几个方向进行整合:
- 对待协同信息(用户的评分)作为额外的特征数据关联于每个例子,并且使用基于内容的技术在这个增广的数据集上
- 将内容特征当成协同设置的不同的维度(即当成虚拟用户的其他评分)
瀑布式
首先使用一种推荐技术产生一个粗糙的候选集合的排序,然后使用另一种技术来优化推荐结果:例如,EntreeC使用自身关于餐馆的知识来基于用户已有的兴趣来进行推荐。这个推荐呗放在同样偏好的箱子(bucket)中,协同技术就用来解开这样的关系。
瀑布方式允许系统避免使用第二种较低优先级的item上的技术在已经被第一步方法很好的分开的item上。但是需要有意义和一致的顺序的技术。
特征的增广
产生一个item的评分或者分类,这个信息然后被用来作为下一个推荐技术的输入:例如,Libra系统基于Amazon上的数据来进行基于内容的书籍推荐,使用一个naiveBayesian分类器;在文本数据上,这个系统包含Amazon使用内部的协同系统产生相关作者和相关名称。和特征组合方式非常的相似:这里的输出给第二个推荐系统使用;在特征组合中,两个系统的代表元素被组合起来使用