异常检测

异常检测工具包识别出不同于输入数据集其他部分的数据点,每个数据点向异常检测模型传递一个异常值(从0到无穷)一描述这个点的异常程度,值越大,异常程度越高,每个模型都给一个阈值(threshold )来判定这个点算不算异常点,这个阈值给用户来自定义.

这个异常检测工具包包含3个模型

  • Local Outlier Factor(LOF)是基于密度的经典算法,针对于具有多个特征和独立观测值的数据集
  • moving Z-score 用于连续数据(通常是一个时间序列)
  • bayesian changepoints 贝叶斯变点 用于识别单变量数据的变化

这三个数据适用于非监督问题,如果您不确定要使用哪个模型,那么创建函数将根据数据集的模式自动选择。

creating an anomaly detection model

create 创建一个异常分析模型

local outlier factor 局部异常因子

local_outlier_factor.create 创建一个局部异常因子模型
local_outlier_factor.get_default_options() 返回模型的参数信息
local_outlier_factor.LocalOutlierFactorModel(state={}) 局部异常因子模型

其余两个模型类似

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 时间序列异常检测 本文总结了我在时间序列异常算法方面的一些经验。读者需要对常规机械学习算法有一定的了解。希望本文能...
    hzyido阅读 19,951评论 7 24
  • iForest (Isolation Forest)孤立森林 是一个基于Ensemble的快速异常检测方法,具有线...
    YeZhu阅读 89,239评论 60 88
  • 简介 LOF算法(Local Outlier Factor,局部离群因子检测方法),是一种无监督的离群检测方法,是...
    晟文刀阅读 11,780评论 0 3
  • 高斯分布是自然界最常见的分布形态,用它来做异常检测是非常合适的模型。枪打出头鸟,那些分布在两端的小概率事件,要么好...
    kamidox阅读 6,134评论 5 22
  • 昨晚我高三的班群里发红包,把人的心都热起来了。我们毕业后都不怎么联系,都在为各自的生活而奔波忙碌。晚上卧谈会的时...
    我是双鱼2阅读 241评论 0 1