协同过滤定义:
基于用户的行为,利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。
- 基于用户的行为,行为越丰富越好,本质上是graph model,考虑的是用户的共同行为。来源:知乎
- 利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。来源:百度
- Collaborative filtering (CF) is the process of filtering for information or patterns
using techniques involving collaboration among multiple agents, viewpoints, data sources, etc.
Applications of collaborative filtering typically involve very large data sets.(协同过滤(CF)是通过多种代理、视点、数据源等协作的技术来过滤信息或模式的过程。协同过滤的应用通常涉及非常大的数据集。来源:维基百科
- 2的定义更好,说清楚user与item之间的关系。协同过滤全都是基于用户行为。包括item CF也是根据用户行为分析其相似性。
国外案例(亚马逊网络书店)
顾客选择一本自己感兴趣的书籍,马上会在底下看到一行“Customer Who Bought This Item Also Bought”,亚马逊是在“对同样一本书有兴趣的读者们兴趣在某种程度上相近”的假设前提下提供这样的推荐,此举也成为亚马逊网络书店为人所津津乐道的一项服务,各网络书店也跟进做这样的推荐服务如台湾的博客来网络书店。
- 亚马逊商店采用了协同过滤,根据用户所所购的商品来推算其他用户所喜欢的产品。
- 有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的。可以发现用户潜在的但自己尚未发现的兴趣偏好。
国内案例(淘宝)
用户在淘宝上购买某一产品后,淘宝惠根据用户所购买的产品来推算用户喜欢的产品。会从“购买此产品的人还购买了”和“猜我喜欢”中推算出。
- 可以增大淘宝商家的赢销量。
- 共用其他人的经验,避免了内容分析的不完全或不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、个人品味)进行过滤。
- 能够过滤机器难以自动内容分析的信息,如艺术品,音乐等。
协同过滤是基于用户的行为,行为越多,协同过滤能更加准确。