推荐系统——二维表格

想学习推荐系统,如何从小白成为高手(https://www.zhihu.com/question/23194692)里有一个回答说:

“关于推荐系统,如果忘掉所有的公式和代码,忘记所有的语言描述,脑海里就剩下几张图景,会是什么?

一张二维表格,一个拓扑图,一条时间线

这三幅图景,是我看待推荐算法的三种视角,分享给大家便于理解。”

这其中的表格就是基于用户对商品评分的表格。


正好前面有写过协同过滤和SVD一些算法,就能都串起来了:

协同过滤算法主要分为两类,一类是基于邻域的方法(neighborhood methods),另一类是隐语义模型(latent factor models)。

基于邻域的方法就是协同过滤里最经典的user-based和item-based:见前面的 https://www.jianshu.com/p/23f03233e26c

基于隐语义模型的就是SVD的众多方法:

SVD:需要填充到一个较为稠密的矩阵,然后奇异值分解,再取较大的k个奇异值对应的m*k k*k k*n的三个矩阵,有点感觉不出这个的意义在哪,明明已经用均值填充到稠密了,然后再基于这个填充的矩阵做SVD,弄一个近似出来

FunkSVD(又称Latent Factor Model):找到合适的矩阵分解来最小化训练集的误差,可以加上正则避免过拟合太严重,从此MF开始大放异彩

BiasSVD:每个分数可能有来自整体的bias,有来自用户的bias,有来自商品本身的bias,把这些bias拿出来,剩下的分数再用矩阵分解的方式建模

SVD++(结合邻域和BiasSVD):这里大概的思想是把每个分数里可能来自领域的再拿出来,并且也做矩阵分解,但是怎么分的我还没弄太明白

加入时间信息的SVD:比如BiasSVD,就把每个值都看做时间的函数,随时间衰减。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容