相似度计算方法:
1. 欧式距离
2. 余弦相识度:
将用户对两个物品的评分做成坐标系,计算两个物品在坐标中的夹角
3. 皮尔逊相关系数
通过皮尔逊相关系数得到的值再去计算相关系数比较靠谱,是对余弦相识度的优化
一般用皮尔逊,如果评分的数据是连续的数值
4. 杰卡德相似度
分数上边是交集,下边是并集
物品2和物品4有两个人是都购买,所以他两个的交集是2
物品2和物品4的所有用户是五个人,所以他们并集是5
最后可以计算出他们的杰卡德系数是2/5
基于人口统计学的推荐机制(Demographic-based Recommendation)是一种最易于实现的推荐方法,它只是简单的根据系统用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户\n对于没有明确含义的用户信息(比如登录时间、地域等上下文信息),可以通过聚类等手段,给用户打上分类标签\n对于特定标签的用户,又可以根据预设的规则(知识)或者模型,推荐出对应的物品\n用户信息标签化的过程一般又称为用户画像(User Profiling)\n用户画像(User Profile)就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作,是企业应用大数据技术的基本方式\n用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息\n作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础