几种相似度的对比

如何结合业务选取一个合适的相似度计算方式?

考虑对item的表征特点,并将item进行细分,定义一些具有代表性的item,尽量考虑全面些,然后人工定义出他们之间的相似关系。之后结合各种相似度的计算,筛选出符合期望的那种相似度,若最后有多个选择,选出解释性强,计算量小的那一种,如果是所有的都被样例item排除,则按照业务重要性,去掉比较不重要的那组样例,继续筛选。

1,余弦相似度

2,皮尔逊相关系数

3,修正的余弦相似度

4,杰卡相似度

5,欧式距离

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容