要解决的问题
DTW、LCSS、EDR都是针对local time shifting问题提出的,但是他们都是non-metric。
提出ERP就是为了同时支持local time shifting以及metric。
(论文中还提及到了ERP的修剪策略)
类似的工作有:
相似度度量方法:
一、欧氏距离:DFT用来降维、R树用来检索。不能处理噪声和local time shifting。
二、DTW:使用重复使用的方法来实现拉伸序列并最终达到处理local time shifting的目的。
三、LCSS:用来实现Time series matching。
四、EDR:通过对轨迹符号化来实现对轨迹的检索和降维(三种修剪方法一起使用)(降维一般指的是修剪时候使用的方法)
DTW、LCSS、EDR都不是metric的方法。
索引方法
metric distance的方法
大多数都followGEMINI框架。例如MVP-Tree、M-tree、Sa-tree、OMNI-family。
ERP算法简介
设 S = [s1, s2, ... , sn]。长度为n。我们可以根据他的均值µ和方差σ进行标准化(归一化):
归一化有助于时间序列进行衰减和全局偏移的时候,两个时间序列的距离是不变的。?
最后一个min,其实就是在决定是不是一个gap:不是gap、s是gap、r是gap。
也可以不使用L1-norm
gap一般取值为0,那样的话岂不是越靠近原点的造成误差越小?
性质:
满足三角不等式
gap=0的原因:
(1)方便几何解释。
横轴是时间间隔(等间隔、均匀的),纵轴是数值。假如按照gap=0来看的话,有利于使用图形解释:所以R、S之间的差距,就对应于R、S之间距离的阴影。
(2)为了最好的匹配R,那么S就要通过添加元素,变成S~。g=0的时候,能够确保 ((求和)S) = ((求和)(S~))。确保S下的面积和S~下的面积是一样的。(so?)(g只要是一个定值,就会满足三角不等式)
总结
DTW其实是在重复使用某些点,而ERP其实是把缺少的点用0来把点补全。()
ERP对噪声有一定的抑制。
其实本来人的判断就不是唯一的:
对于Q和T2,Q和T4,到底哪一组最相似,每个人的判断都不一样。每个人对于离群点的介意程度也不一样。那么在这个系统中,就是要先确定好,系统对离群点是否能忍受,又能够忍受到什么程度。