ERP

要解决的问题

DTW、LCSS、EDR都是针对local time shifting问题提出的,但是他们都是non-metric。

提出ERP就是为了同时支持local time shifting以及metric。

(论文中还提及到了ERP的修剪策略)

类似的工作有:

相似度度量方法:

一、欧氏距离:DFT用来降维、R树用来检索。不能处理噪声和local time shifting。

二、DTW:使用重复使用的方法来实现拉伸序列并最终达到处理local time shifting的目的。

三、LCSS:用来实现Time series matching。

四、EDR:通过对轨迹符号化来实现对轨迹的检索和降维(三种修剪方法一起使用)(降维一般指的是修剪时候使用的方法)

DTW、LCSS、EDR都不是metric的方法。

索引方法

metric distance的方法

大多数都followGEMINI框架。例如MVP-Tree、M-tree、Sa-tree、OMNI-family。

ERP算法简介

设 S = [s1, s2, ... , sn]。长度为n。我们可以根据他的均值µ和方差σ进行标准化(归一化):

image.png

归一化有助于时间序列进行衰减和全局偏移的时候,两个时间序列的距离是不变的。?

image.png

最后一个min,其实就是在决定是不是一个gap:不是gap、s是gap、r是gap。

image.png

也可以不使用L1-norm

gap一般取值为0,那样的话岂不是越靠近原点的造成误差越小?

性质:

满足三角不等式

gap=0的原因:

(1)方便几何解释。

image.png

横轴是时间间隔(等间隔、均匀的),纵轴是数值。假如按照gap=0来看的话,有利于使用图形解释:所以R、S之间的差距,就对应于R、S之间距离的阴影。

(2)为了最好的匹配R,那么S就要通过添加元素,变成S~。g=0的时候,能够确保 ((求和)S) = ((求和)(S~))。确保S下的面积和S~下的面积是一样的。(so?)(g只要是一个定值,就会满足三角不等式)

总结

DTW其实是在重复使用某些点,而ERP其实是把缺少的点用0来把点补全。(
image.png

ERP对噪声有一定的抑制。

其实本来人的判断就不是唯一的:

image.png

对于Q和T2,Q和T4,到底哪一组最相似,每个人的判断都不一样。每个人对于离群点的介意程度也不一样。那么在这个系统中,就是要先确定好,系统对离群点是否能忍受,又能够忍受到什么程度。

image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、云计算的概念 云计算是一个泛化概念的技术名词,包含的意义及其外延相当广泛。它是一种动态、易扩展的且通常是通过互...
    Sky云ERP阅读 1,399评论 1 8
  • 我最近无意间,看到了豆豆发布了个活动通知,就是写一篇关于母亲的文章,或者趣配音,于是我就想了一下,我问自己,我要不...
    匀速小跑阅读 206评论 0 1
  • 暗恋就是飞蛾扑火般,有些事明知不可能,心却不能由理智控制,它会失控,越陷越深,你越是忽略,最后反被反噬。会因为对方...
    小楼月夜阅读 123评论 0 0
  • Why I Love C   Note! I am not saying that other programin...
    RFSC阅读 296评论 0 1
  • 5月21日伊河团委邀请到“中国梦肢队”宣讲团到学校进行“传递正能量”全国公益励志巡回演讲。这是一批装...
    王玲霞阅读 158评论 0 3