两个信号等效特性安排在相同的顺序可以出现不同的由于时间的差异部分。功能
扭曲了这些时间对应的特征出现在相同的位置在一个共同的时间轴,从而突出信号之间的相似性。标准用于执行失真被设计成健壮的异常值。
考虑这两个K维信号
和
哪有米和N样本,分别。鉴于d锰(X,Y)之间的距离米th的样本X和nth的样本Y中指定的度规
,功能
功能的延伸X和Y上一组通用的瞬间,编辑距离信号之间的最小。
鉴于ε一个实数,在指定的公差托尔
声明,米th的样本X和nth的样本Y匹配如果d锰(X,Y)<ε。如果两个样品,米和n不匹配,你可以让他们匹配的三种方式:
删除米从第一个信号,如当第二样本匹配n。这个删除是相当于增加米第二个信号,获得连续两场比赛。
延长第一信号通过添加位置相匹配的一个示例n和取代其他的样品位置。这相当于将无可匹敌的n从第二个信号。
替代米与n在第一信号,或者,同样,删除米和n。
编辑距离的总数这些操作需要两个信号匹配。这个数字并不是唯一的。计算最小编辑距离X和Y从这些事实:
两个空信号之间的零距离。
一个空的信号和信号之间的距离l样品是l,因为这是样品的数量必须添加到空信号恢复另一个。同样,l是样品的数量,必须远离一个了吗l样本信号空。
创建一个(米+ 1)————(N+ 1)矩阵,D,比如:
D1,- 1= 0。
D米,1=米- 1为米= 2,…米+ 1。
D1,n=n- 1为n= 2,…N+ 1。
为米,n> 1,
最小编辑距离X和Y然后D米+ 1,N+ 1。
的扭曲的路径通过D结果在这个最小编辑距离由两个序列长度相同的参数化,第九
和iy
,是“国际象棋王”动作的组合:
垂直移动:(米,n)→(米+ 1,n)对应于移除一个样本X或者增加一个样本Y。每个移动增加了编辑距离1。
水平移动:(米,n)→(米,n+ 1)对应于移除一个样本Y或者增加一个样本X。每个移动增加了编辑距离1。
对角线移动:(米,n)→(米+ 1,n+ 1)如果对应于一个匹配dm, n(X,Y)≤ε或对应于从每个信号如果删除一个样本dm, n(X,Y)>ε。比赛不增加距离。删除增加1。
这种结构确保任何可接受的路径将完整的信号,不跳过样品,不重复信号特性。此外,一个理想的路径运行之间的对角线长d1,- 1(X,Y),dM, N(X,Y)。这种额外的限制,调整的maxsamp
参数,确保了翘曲比较部分相似的长度。
制作两个样品匹配的点球是独立样本之间的差异值。两个样品,多一点宽容不同产生相同的处罚明显不同的两个样品。出于这个原因,编辑距离不受异常值影响。相反,重复样本对齐两个信号是有成本的,这不是动态时间扭曲的情况。