协同过滤
定义:
- 协同过滤(Collaborative Filtering)技术,是推荐系统中应用最为广泛的技术之一,它基于一组兴趣相同的用户进行推荐。准确来说是一种方法论,它假设可以通过购买或使用历史找出近似的用户或商品。来源:(https://www.zhihu.com/question/21507689%EF%BC%89)
- 协同过滤,Collaborative Filtering(简称:CF)。 基于集体用户智慧,在一定相关基础上,有比较好的丰富度,可以帮助用户发现潜在兴趣。来源:知乎喵姐(https://zhuanlan.zhihu.com/p/24045987)
- 协同过滤(Collaborative Filtering,CF)是推荐系统广泛使用的一种技术,它主要通过考虑用户(User)与用户之间、物品(Item)与物品之间的相似度(Similarity),来向用户推荐物品。、协同过滤算法得到的是对一件item的评分。协同过滤将评分最高的item推荐给user。协同过滤得到的推荐是有排序的,评分越高,推荐的程度就越高。 - 定义来源:(知乎用户)</mark>
- 协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。
举例:
国外案例: -GroupLens 这个系统主要是应用在新闻的筛选上,帮助新闻的阅听者过滤其感兴趣的新闻内容,阅听者看过内容后给一个评比的分数,系统会将分数记录起来以备未来参考之用,假设前提是阅听者以前感兴趣的东西在未来也会有兴趣阅听,若阅听者不愿揭露自己的身分也可以匿名进行评分。 和Tapestry不同之处有两点,首先,Tapestry专指一个点(如一个网站内、一个系统内)的过滤机制;GroupLens则是跨点跨系统的新闻过滤机制。再来,Tapestry不会将同一笔资料的评比总和起来;GroupLens会将同一笔资料从不同使用者得到的评比加总。
让我们知道的理由 GroupLens具有以下特点:开放性所有的新闻阅听者皆可使用,虽然系统委托Better Bit Bureau设计给分的系统,但若有不同的评分机制也适用于GroupLens。方便性:给分并不是一件困难的事情且沟通上非常方便,评分结果容易诠释。规模性:有可能发展成大规模的系统,一旦发展成大规模,储存空间与计算成本问题显得相当棘手。隐密性:如果使用者不想让别人知道他是谁,别人就不会知道。由此可以看出,现今网络各个推荐系统的雏形已然形成,在GroupLens之后还有性质相近的MovieLens,电影推荐系统;Ringo,音乐推荐系统;Video Recommender,影音推荐系统;以及Jster,笑话推荐系统等等。乃至于今日的YouTube、aNobii皆是相似性值得网络推荐平台,较不同的是经过时间推移,网络越来越发达,使用者越来越多,系统也发展得越来越严密。与Tapestry相比,GroupLens的过滤机制更加的全面。 不同的评分机制也适用于该系统,不只是局限于一个评分机制。**
为何符合定义:1、这个系统会对一些内容进行筛选,根据读者的爱好以及感兴趣的方面进行推荐。 2、有着一套评分系统,并且可以将不同使用者的评比加总,更加方便读者的交流以及能让读者得到更加全面的信息。
- :网易云音乐是一款专注于发现与分享的音乐产品,依托专业音乐人、DJ、好友推荐及社交功能,在线音乐服务主打歌单、社交、大牌推荐和音乐指纹,以歌单、DJ节目、社交、地理位置为核心要素,主打发现和分享。网易云音乐让用户通过绑定手机通讯录、#微博、人人网等发现已有用户,关注对方后,可以看到朋友的音乐行为。用户可以查看身边在使用网易云音乐听歌的人和他在听的歌曲,也可以添加关注。它会根据用户所听或所搜的歌曲推出“猜你喜欢”的歌单;用户对音乐的喜欢与否或是音质的问题也会对歌曲的评分有影响。
-
==
为何符合定义
1.能够过滤难以进行机器自动基于内容分析的信息。 2.推荐的新颖性。 3、人性化设计及个性化推行
- 为何值得我们知道? 一、提供更人性化的服务会提高用户的使用率,既满足用户需求又带动产业发展。 二、更便捷和人性化的服务证明了我国科技技术正一步步地成熟,我们时刻关注社会发展,才利于个人自身的发展。
- 国内案例
今日头条:引入个性化推荐的策略。他们所采用的,是协同过滤(Collaborative Filtering) + 基于内容推荐 +热门推荐
- 为何值得我们知道
1.它是我国网络门户落幕的标志,是我国网络媒体进入一个新阶段的标志。具有代表性。
2.它是基于多种推荐方式相结合,我们通过了解可以更好地知道不同推荐方式之间的区别。
- 为何符合定义:
1.通过分析文章的相似程度来推荐给用户,这体现定义中的物品与物品之间的相似度。
2.100篇新的文章出来之后,对部分用户进行了曝光,然后就可以根据用户相似度,来预计其他用户对这篇文章的兴趣度,进而挑选这100篇中预计兴趣度最高的30篇曝光给这群用户。这体现了定义中用户与用户之间的相似度。
与传统文本过滤相比,协同过滤有下列优点:
能够过滤难以进行机器自动基于内容分析的信息。如艺术品、音乐;
能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤;
推荐的新颖性。
正因为如此,协同过滤在商业应用上也取得了不错的成绩。Amazon,CDNow,MovieFinder,都采用了协同过滤的技术来提高服务质量。
缺点是:
用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题);
随着用户和商品的增多,系统的性能会越来越低;
如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。
因此,现在的电子商务 推荐系统都采用了几种技术相结合的推荐技术。