共享最近邻相似度SNN原理
如果向个点都与一些相同的点相似,则即使直接的相似度度量不能指出,我们也认为他们相似。
SNN主要解决两类问题:1.传统相似度在高维的相似度计算中,低相似度的问题。2.密度不同。
SNN相似度就是两个点之间共享的近邻个数,前提:两个点互相包含。
伪代码
if 点x 和 点y 不是互相的k-近邻 then
sim = 0
else
sim = 相同近邻数
优点:
1.解决了直接使用传统的相似度计算相似度值低的问题。
2.簇的密度不同,在低密度的簇中,点与点之间的距离相对较大,而 SNN只依赖于共享的近邻个数。