什么是Racommender system
A system which could recommand stuff based on others people did
为什么要使用推荐系统
在购物网站上,我们有太多的选择
广告的种类太多
找到最好的网站
推荐影片和书籍
帮助用户选择他们想要的,帮助用户根据goal做正确的决定
推荐的算法
基于特征的推荐算法 Feature Based (content based)
基于一件事物的特点推荐另一件事物,比如说超人1的电源会推荐超人2
喜欢一个导演就会推荐这个导演的作品;喜欢一个演员就会推荐这个演员的作品
推荐可以给予该用户对于一件事物的rate, Recommendation based on the commonalities among
the items that a user has rated before
Feature Based 算法优点
- 不需要复杂的计算就可以离线处理,计算时间少
- 推荐的东西便于解释
比如说Gmail AD他会根据你的Email分析出你喜欢什么东西,从而发送广告给你
Feature Based 算法问题
- Overspecialization
- 仅推荐与评级过的东西相似的东西,比如说超人1那么只会推荐DC的Mavel的电影,然而哈利波特将会无法被推荐
- 特性取决于上下文、和内容的种类
- 没有小组智慧 No Wisdom from Group
协同过滤算法 Collaborative filtering
基于其他用户的评价,或者是基于邻居或相同或相似的人的意见(Neighboor)
它使用统计学的方法,从而做出对于相似用户和产品的预测,统计方法有两种:一种是User to User,一种是item to item
比如说,其他用户买了这本书的同时也购买了另一本书,所以,也向你推荐另一本书
协同过滤算法的好处
- Content is irrelevant, 任何内容无关紧要
- 拥有了群组智慧
- 在商业界和学术界最常用adopted and studied
协同过滤算法问题
- Cold Start Problem,就是必须要有几个rating该算法才可以执行
- Too Expensive,算法比较复杂
- 人类是会变得,有时候他的爱好会产生变化
混合算法 Hybird
就是基于feature base 和 Collaborative filtering
不会的知识点
User to user的算法
- Build Matrix of thing each user bought / viewed / rated
- Compute similarity between user
- Find similar user to you
- Recommand stuff they bought/ view rate that you have not yet.
item to item的算法
根据你喜欢什么推荐相似的东西,因为一本数学书永远都是数学书,但是一个人就一直都会变;所以说item based similarity change less frequently than user based similarity
比user更好的原因是,我们只需要处理几个item就可以了,而如果我们需要处理user的话,就需要处理很多人。
Less storage, Faster computing
想要看到更多玮哥的学习笔记、考试复习资料、面试准备资料?想要看到IBM工作时期的技术积累和国外初创公司的经验总结?
敬请关注: