推荐系统概述
所谓推荐系统,就是向用户推荐用户可能会喜欢的元素(item),这个元素可以是各种内容,比如看什么新闻(头条),买什么东西(淘宝),听什么音乐(网易云)。
分为个性化推荐和非个性化推荐两大类。
个性化推荐:指的是对每个用户都有不同的推荐内容
非个性化推荐:指的是按热度推荐(topN),按地区推荐等等。两种推荐方式在不同场景下都有一定的效果。
推荐系统的意义
- 出售更多的商品
- 增加用户满意度
- 出售多种类型的商品
- 增加用于忠诚度
推荐系统的架构
通过用户推荐点击行为可以获得用户日志(用户行为:点击、停留、跳过等等)
预测方式
- 评分预测方式: 推荐系统的最终结果是预测用户对物品(item)打分的结果,选择分数靠前的推荐给用户。
- TopN方式:就是所有人收到的都一样,不会受到用户物品关联性影响。
评估方式
可以将推荐系统的运行过程看作一个回归问题或者分类问题。可以通过类似的指标进行衡量:
- 均方误差:MSE Mean Square Error,估计值与真实值之差平方的期望值,用户u对物品i的评分的均方误差
- 均方根误差: RMSE Root Mean Square Error,就是均方误差开个根号
- 平均绝对误差:MAE Mean Absolute Error ,
- 一致序列对比率评分:FCP Fraction of Concordant Pairs。计算评分一致的物品在所有物品对中的占比。
一致的部分
不一致的部分
通过公式可以看出,FCP指的就是预测值和实际值偏差方向一致的比例。