这是一篇结合embedding和cluster任务的论文,具体模型分为两部分
1 使用DNN生成每个节点xi对应的embedding zi,然后计算zi属于每一个cluster center中心的概率(soft assignment)。这个相似度可以通过以下公式来计算:
其中,zi是通过f()这个神经网络计算出来的embedding,而qij可以表示节点i属于cluster j的概率(soft assignment)。
2 第二步是通过最小化第一步的q和一个辅助分布的KL散度,使用BP来达到优化DNN和重新调整cluster center的目的。
目标函数如下:
优化方法:
通过反向传播优化DNN,通过计算梯度来调整cluster的中心,公式如下: