CF FM 传统的机器学习lightfm lightgbmranker 多标签分类 深度学习 多路召回
L2R算法主要包括三种类别:PointWise,PairWise,ListWise
评价指标
auc recall ndcg hitrate precsion
冷启动:用户冷启动 物品冷启动 系统冷启动
热度推荐 内容推荐 挖掘更多信息
协同过滤分为两种,一种是基于用户,一种是基于商品。Amazon的工作采用的是ItemCF,即基于商品,因为用户的行为数据往往过于稀疏。协同过滤简单可解释,但不具备泛化能力。具体的体现就是,尾部的商品因为数据稀疏,在计算与其他商品的相似度时往往趋于零,导致尾部商品大概率不被推荐,但其实它未必对客户不重要。
Netflix在2006年提出了矩阵分解技术,其很好解决了上述问题。通过矩阵分解,用户和商品都得到了与其对应的隐向量,泛化能力很强。不过矩阵分解(奇异值分解)计算量很大,并且不适合处理大规模稀疏矩阵。
逻辑回归可以很好的解决上述问题。逻辑回归即一个线性模型再套一个Sigmoid层,经过训练每一个因子前的权重代表这个因子对因变量的重要程度,而且最后的因变量还在0-1之间。逻辑回归的好处很多。