[发明专利]一种时间序列相似性计算装置和方法有效
申请号: | 201910080442.4 | 申请日: | 2019-01-28 |
公开(公告)号: | CN109783051B | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 鄢贵海;卢文岩;朱凯 | 申请(专利权)人: | 中科驭数(北京)科技有限公司 |
主分类号: | G06F7/02 | 分类号: | G06F7/02 |
代理公司: | 北京金咨知识产权代理有限公司 11612 | 代理人: | 宋教花 |
地址: | 100190 北京市海淀区科学*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 序列 相似性 计算 装置 方法 | ||
本申请提供了一种时间序列相似性计算装置和方法,该装置包括:序列缓冲器,用于缓存第一时间序列和作为模板序列的第二时间序列;距离运算单元,用于计算第一时间序列的元素值和第二时间序列的元素值之间的距离,得到距离矩阵;存储单元,用于存储第一时间序列的多个滑动窗口对应的距离矩阵;多个累加距离运算单元,用于根据滑动窗口长度和模板序列的长度,在多个滑动窗口内复用所述距离矩阵的元素并基于动态时间规整算法并行计算第一时间序列在各个滑动窗口内的子序列与第二时间序列的规整路径距离;以及控制逻辑,用于对所述序列缓冲器、距离运算单元和多个累加距离运算单元进行逻辑控制。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种时间序列相似性计算装置和方法。
背景技术
时间序列是金融计算中常见的数据形式。对于时间序列处理来说,一个普遍的任务就是比较两个时间序列的相似性。在实际应用中,时间序列的长度往往并不相等,传统的欧式距离无法有效衡量不等长时间序列之间的相似性,由此引入了动态时间规整算法(Dynamic Time Warping,DTW)。DTW是一种基于动态规划(Dynamic Programming,DP)的序列匹配算法,它通过时间序列补齐和距离累积的方式来计算两个不等长时间序列的相似性,广泛应用于模式识别,数据挖掘和信息检索中。具体算法如下所述:
若时间序列X和时间序列Y的长度分别为n和m,即
X(X(1),X(2),X(3),...,X(i),...,X(n));
Y(Y(1),Y(2),Y(3),...,Y(j),...,Y(m));
根据时间序列X和Y可构建m*n阶矩阵:
矩阵元素d(i,j)表示时间序列X的元素值xi和时间序列Y的元素值yj之间的距离。动态时间规整算法的核心思想在于寻找一条通过矩阵元素的路径,使得路径上矩阵元素d(i,j)的累加和最小,路径通过的元素即为计算两个时间序列相似性的点,路径的累积距离就是两个时间序列的相似性。
定义规整路径W(Warping Path):
W=w1,w2,…,wi,…,wkmax(m,n)≤k≤m+n-1
规整路径W将时间序列X的时间轴n非线性地映射到时间序列Y的时间轴m上,并且满足式中D(n,m)为规整路径的累积距离,或称规整路径距离。规整路径需要满足以下约束条件:
(1)边界条件:w1=(1,1),wk=(m,n)
(2)单调连续条件:若wi-1=(a,b),wi=(a′,b′),则a′-a=0,1,且b′-b=0,1。
目前,基于动态时间规整算法的大规模时间序列处理往往采用通用处理器来实现,而摩尔定律的放缓使得通用处理器的性能提升有限,数据规模的与日俱增更加凸显了通用处理器计算能力的不足。因此,目前基于动态时间规整算法的大规模时间序列处理受限于硬件的运算速度,无法满足大数据实时处理的需求,同时系统的能耗也相对较高。
发明内容
有鉴于此,本发明提出了一种基于滑动时间窗口的时间序列相似性计算装置和方法,以专用的数据架构实现对时间序列的高效处理,来快速计算时间序列间的相似性。
本发明的一个方面提供一种时间序列相似性计算装置,该装置包括:
序列缓冲器,用于缓存第一时间序列和作为模板序列的第二时间序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科驭数(北京)科技有限公司,未经中科驭数(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910080442.4/2.html,转载请声明来源钻瓜专利网。