基于直方图的异常估计HBOS

主要思想:画出数据分布的直方图,根据数据的频率计算异常程度,认为直方图中频率越小越异常。
特点
1. 难以确定最佳带宽
2. 高维清醒下效果不佳

过程:
假设数据x = \lbrace x_{1},x_{2},...x_{n}\rbrace各个维度之间相互独立。

\begin{eqnarray} P(x)& = &P(x_{1})P(x_{1})...P(x_{1})\\ log(P(x) )&= &\sum_{i=1}^dlog(P(x_{i}))\\ -log(P(x))&= &-\sum_{i=1}^dlog(P(x_{i}))\\ &=&\sum_{i=1}^dlog(\frac{1}{P(x_{i})})(频率估计概率)\\ 有:\\ HBOS(x) &= &\sum_{i=1}^dlog(\frac{1}{hist(x_{i})})\\ &=&-\sum_{i=1}^dlog({hist(x_{i})}) \end{eqnarray}
为防止某一区间内频数较小,可以加\varepsilon增加容忍度
异常得分: HBOS(x) = -\sum_{i=1}^dlog({hist(x_{i})}+\varepsilon)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。