[发明专利]一种基于DTW距离的交通流量序列相似性度量方法有效
申请号: | 201910413761.2 | 申请日: | 2019-05-17 |
公开(公告)号: | CN110135642B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 王炜;李欣然;卢慕洁 | 申请(专利权)人: | 东南大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G08G1/01 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 蒋昱 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dtw 距离 交通 流量 序列 相似性 度量 方法 | ||
本发明提供了一种基于DTW距离的交通流量序列相似性度量方法,属于交通数据分析技术领域,包括以下步骤:(1)获取需要进行相似性度量分析的若干个交通流量时间序列;(2)任意两个交通流量时间序列划分为一组,组内进行数据标准化处理;(3)计算组内两序列中任意两个元素之间的欧式距离,构成匹配全集矩阵;(4)根据边界条件、连续性、单调性和局部最优等规则,确定最优匹配路径;(5)计算最优匹配路径上各匹配元素之间的平均DTW距离,用于衡量两个序列之间的相似性。本发明步骤简明,逻辑清晰,度量结果科学有效,对城市道路、交叉口流量时间序列之间的相似性分析提供了有力的技术支撑,为挖掘大数据中蕴藏的交通本质信息奠定了基础。
技术领域
本发明涉及交通数据分析技术领域,特别是涉及一种基于DTW距离的交通流量序列相似性度量方法。
背景技术
近年来,随着计算机技术的快速发展,在传感器、无线通信、存储技术等方向的研究不断深入,时间序列数据在交通、互联网、气象、天文、医疗等领域的规模呈爆炸式增长。时间序列的相似性度量是时间序列分类、聚类、异常发现等诸多数据挖掘问题的基础,也是时间序列数据挖掘的核心问题之一。时间序列相似性度量主要是基于距离的度量,即两组序列之间的距离越小,则两个序列越相似。
在传统的时间序列相似性度量中,欧氏距离是最常用的衡量两个时间序列相似性的距离。但是欧氏距离对序列在时间轴上的轻微变化非常敏感,时间轴上的微小变形会引起欧氏距离较大变化,造成相似性度量失真。此外,计算欧式距离还要求两个时间序列之间的元素一一对应,这也就导致了欧式距离只适用于元素个数相同的时间序列之间的相似性度量。
动态时间归整(Dynamic Time Warping,简称DTW)是一种时间序列分析算法,DTW算法是语音识别中出现较早、较为经典的一种算法,广泛应用于孤立词识别领域。DTW 算法采用动态规划的思想,解决了因语速不同而导致的发音长短不一的模板匹配问题。事实上,不仅仅是语音识别,图片、视频等任何可以转化为一个线性时间序列的数据都可以采用DTW算法进行相似性分析。
在交通领域,交通流量时间序列广泛存在,由于交通流运行过程中“时滞”的存在以及在交通流量统计过程中可能存在的数据缺失,导致交通流量时间序列不能采用传统的“一一对应”的方式求取欧式距离来衡量相似性,为此本发明提出了一种基于DTW距离的交通流量序列相似性度量方法,提高了时间序列相似性度量的准确度,同时满足不同长度的时间序列之间的相似性度量。
发明内容
为了解决以上问题,本发明提供一种基于DTW距离的交通流量序列相似性度量方法,本发明的目的是以DTW距离为指标,对交通流量信息相似性特征予以量化,避免传统方法中采用欧式距离衡量时间序列相似性存在的问题。本发明提供的方法,在交通时间序列数据挖掘领域具有重要的应用价值,为达此目的,本发明提供一种基于DTW距离的交通流量序列相似性度量方法,包括以下步骤:
(A)获取需要进行相似性度量分析的若干个交通流量时间序列;
(B)任意两个交通流量时间序列划分为一组,组内进行数据标准化处理;
(C)计算组内两序列中任意两个元素之间的欧式距离,构成匹配全集矩阵;
(D)根据边界条件、连续性、单调性和局部最优等规则,确定最优匹配路径;
(E)计算最优匹配路径上各匹配元素之间的平均DTW距离,用于衡量两个序列之间的相似性。
本发明的进一步改进,所述步骤(A)中,交通流量时间序列中的元素内容为固定时间间隔内交通流量的统计值,不同序列中元素的量纲必须相同,元素的个数可以相同也可以不同。
本发明的进一步改进,所述步骤(B)中,采用Min-Max数据标准化方法对原始序列数据进行线性变换,标准化处理之后的序列元素数值均位于区间[0,1]之间,线性变换公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910413761.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理