协同过滤总结心得:
协同过滤被用于分辨某类特定顾客可能感兴趣的东西,这就好比在图书馆的图书分类,书籍有不同的种类,人们可以通过自己的兴趣去选择哪一个区域的书籍,这样人们也容易寻找到书籍,而且书籍也不会混乱,根据顾客的兴趣不仅仅局限于书籍,对于互联网也是一样,网站通过各客每天的点击率的相关内容来分辨顾客的兴趣爱好,使之后的推送中会根据顾客感兴趣的内容来推送,就像今日头条这一新闻网站,他会根据顾客的日点击率,系统自动统计,如果这位顾客经常点击娱乐新闻,那么他们会在推送中会在顾客的页面上大部分会推送娱乐新闻:又如现在最大的购物网站淘宝网,淘宝网会根据你这一天或这几天所浏览的商品系统自动统计,然后会在猜你喜欢等方式向你推送。所以,在现在的社会中,协同过滤发挥着重要的作用。
定义
协同过滤常常被用于分辨某类特定顾客可能感兴趣的东西,这些结论来自于对其他相似顾客对哪些产品感兴趣的分析。协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热。
在百度百科中的定义
协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。
必应百科中的定义
协同过滤常常被用于分辨某类特定顾客可能感兴趣的东西,这些结论来自于对其他相似顾客对哪些产品感兴趣的分析。协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热。
新浪中的定义
协同过滤推荐(Collaborative Filtering recommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。
我们认为三种定义中最好的是新浪。因为它首先简要明了地为“协同过滤”下了个定义。然后介绍了它的用途,受众性,并把它与之前传统的技术进行比较,对比区别两者之间的不同,引出“协同过滤”的优点和优势。
与传统文本过滤相比,协同过滤有下列优点:
(1)能够过滤难以进行机器自动基于内容分析的信息。如艺术品、音乐;
(2)能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤;
(3)推荐的新颖性。
缺点是:
(1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题);
(2)随着用户和商品的增多,系统的性能会越来越低;
(3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。
案例: AMAZON个性化推荐系统先驱 (基于协同过滤)
AMAZON是一个虚拟的网上书店,它没有自己的店面,而是在网上进行在线销售。它提供了高质量的综合节目数据库和检索系统,用户可以在网上查询有关图书的信息。如果用户需要购买的话,可以把选择的书放在虚拟购书篮中,最后查看购书篮中的商品,选择合适的服务方式并且提交订单,这样读者所选购的书在几天后就可以送到家。
AMAZON书店还提供先进的个性化推荐功能,能为不同兴趣偏好的用户自动推荐尽量符合其兴趣需要的书籍。 AMAZON使用推荐软件对读者曾经购买过的书以及该读者对其他书的评价进行分析后,将向读者推荐他可能喜欢的新书,只要鼠标点一下,就可以买到该书;AMAZON能对顾客购买过的东西进行自动分析,然后因人而异的提出合适的建议。读者的信息将被再次保存,这样顾客下次来时就能更容易的买到想要的书。此外,完善的售后服务也是AMAZON的优势,读者可以在拿到书籍的30天内,将完好无损的书和音乐光盘退回AMAZON,AMAZON将原价退款。当然AMAZON的成功还不止于此,如果一位顾客在AMAZON购买一本书,下次他再次访问时,映入眼帘的首先是这位顾客的名字和欢迎的字样。