上一次讲了《相似度计算方法:余弦相似度》中,提到了推荐系统中的基于用户的协同过滤算法,由于用户的行为数据,很适合用二分图的数据结构描述,因此很多图的算法可以在推荐系统中使用,专业人员称为 Graph based Model,基于图的模型,今天来看看基于图的推荐算法。
二分图
先来回顾下二分图这个数据结构
背书中
二分图又称作二部图,是图论中的一种特殊模型。 设G=(V,E)是一个无向图,如果顶点V可分割为两个互不相交的子集(A,B),并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i in A,j in B),则称图G为一个二分图
通俗的讲
二分图就是在一个图中,将顶点集分成A和B,在这个图中,所有边的两个顶点都分别在顶点集A和B,顶点集A中的顶点不会连向顶点集A中的顶点,顶点集B中的顶点不会连向顶点集B中的顶点
灵魂画师上图了
看了图大家基本能回想起来二分图了,关于二分图还有匹配和求最大匹配的算法,以后在二分图的章节里面在说吧
用二分图描述用户行为数据
使用电商系统做为业务背景,顶点集A为用户顶点集,顶点集B为商品顶点集用新的图,顶点之间的边代表用户关注过商品,构成一个简单的用户关注商品的二分图