简介
Deep autoencoding gaussian mixture model for unsupervised anomaly detection.ICLR-2018,cited-140.
unofficial,pytorch,star-163.
unofficial,pytorch,star-28.
关键字
VAE,Gaussian mixture,Anomaly detection,Unsupervised
正文
1. 模型
任务:无监督检测异常点,使用VAE+GMM为基本框架,直接使用重构误差和隐变量特征来学习混合高斯参数,根据学习到的结果预测异常点。如图(原文Fig2)所示,有两个子结构,左边是VAE,右边是GMM,注意GMM的输入由特征+重构误差结合而来。
image.png
2. 目标函数
按照上方的思路和模型首先得有个重构损失,接下来希望样本能够明确属于混合高斯的某个成分,目标函数如下:
image.png
这里面的第1项是重构损失,使用,第2项是希望样本明确属于某个成分,即越接近某个成分的均值越好,也可以认为是属于某个成分的概率越高越好,计算方法如下,思路大致是各类概率的期望,类似交叉熵的负对数损失:
image.png
其中,类比例,类均值,类方差的计算分别如下:
image.png
实验在KDDCUP,Thyroid,Arrhythmia,KDDCUP-Rev上完成,不太熟悉,略过。
参考资料
[1] Zong, Bo, et al. "Deep autoencoding gaussian mixture model for unsupervised anomaly detection." (2018).