SNN相似度计算

共享最近邻相似度SNN原理

如果向个点都与一些相同的点相似,则即使直接的相似度度量不能指出,我们也认为他们相似。

SNN主要解决两类问题:1.传统相似度在高维的相似度计算中,低相似度的问题。2.密度不同。

SNN相似度就是两个点之间共享的近邻个数,前提:两个点互相包含。

伪代码

if 点x 和 点y 不是互相的k-近邻 then
sim = 0
else
sim = 相同近邻数

image.png

优点:

1.解决了直接使用传统的相似度计算相似度值低的问题。
2.簇的密度不同,在低密度的簇中,点与点之间的距离相对较大,而 SNN只依赖于共享的近邻个数。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容