[发明专利]一种时间序列数据的最长公共子串提取方法在审
申请号: | 201910525678.4 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110232076A | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | 黄辰;张蔚;潘宜霞;王杰 | 申请(专利权)人: | 中国电子科技集团公司第二十九研究所 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 管高峰 |
地址: | 610036 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间序列数据 最长公共子串 公共子串 符号化 等价 读取 符号化处理 长度提取 滑动窗口 计算参数 快速提取 量化处理 时间特征 时间序列 搜索 存储 | ||
本发明公开了一种时间序列数据的最长公共子串提取方法,包括如下步骤:步骤1,读取待比较的时间序列数据;步骤2,选取时间序列数据的时间特征参数作为计算参数,对时间序列数据进行差分变换、量化处理,以及符号化处理后,得到符号化序列;步骤3,根据所述符号化序列建立时间序列数据的等价字符表;步骤4,根据所述等价字符表,采用动态滑动窗口的方式,搜索并存储时间序列数据的公共子串;步骤5,通过判断所述公共子串的长度提取最长公共子串。本发明的时间序列数据的最长公共子串提取方法可以快速提取时间序列数据的最长公共子串,且在时间序列存在数据部分丢失的情况下同样有效。
技术领域
本发明涉及最长公共子串提取,尤其是一种时间序列数据的最长公共子串 提取方法。
背景技术
利用数据挖掘技术从时间序列数据中提取最长公共子串对于衡量不同时间 序列数据间的相似度来说具有重要意义。现有的最长公共子串(Longest Common Substring)求取方法广泛应用于文本相似度比较、图形相似处理、程序代码相 似比较、媒体流相似比较、基因序列比对、轨迹分类等应用领域。
目前,研究者们针对不同的应用领域,对LCS问题已经做了大量工作:
中国航天科技集团公司第710研究所张毅超等人于2007年12月在《计算 机仿真》的《求最长公共子串问题的算法分析》一文中提出一种新算法,该算 法利用两个字符串广义后缀数组,在保持和广义后缀树复杂度相等的基础上, 能简单实现并具有较小的空间占用度。
中国工程物理研究院计算机应用研究所及电子工程研究所王开云等人在 2013年《计算机研究与发展》的《两种基于双向比较的最长公共子串算法》一 文中提出两种基于双向比较的最长公共子串算法LCSstrSel和LCSstrSCel,通 过增加字符跨越等机制,提高了平均计算效率。
以上方法均从求解LCS的角度出发,在一定程度上提升了算法性能,但对 于时间序列尤其是时间序列数据的最长公共子串而言,要兼顾到对数据丢失情 况的适应性,则并没有完全适合的研究论著,以上方法可以做一些借鉴,但要 达到理想效果,还需要有针对性的研究适合于时间序列数据的最长公共子串提 取方法。
发明内容
本发明所要解决的技术问题是:针对上述存在的问题,提供一种时间序列 数据的最长公共子串提取方法。
本发明提供的一种时间序列数据的最长公共子串提取方法,包括如下步骤:
步骤1,读取待比较的时间序列数据;
步骤2,选取时间序列数据的时间特征参数作为计算参数,对时间序列数 据进行差分变换、量化处理,以及符号化处理后,得到符号化序列;
步骤3,根据所述符号化序列建立时间序列数据的等价字符表;
步骤4,根据所述等价字符表,采用动态滑动窗口的方式,搜索并存储时 间序列数据的公共子串;
步骤5,通过判断所述公共子串的长度提取最长公共子串。
进一步地,所述步骤2中选取时间序列数据的时间特征参数作为计算参数, 对时间序列数据进行差分变换、量化处理,以及符号化处理后,得到符号化序 列的方法,包括:
步骤2.1,要将时间序列数据的时间特征参数进行差分变换后作为一维输 入参数;
步骤2.2,所述一维输入参数作为主要因素决定了空间上的一点,将这个 空间按照可提前设定的动态阈值进行自适应性的区域划分,划分的每个区域对 应着一个量化值,对所有量化值依次打上符号标签,得到符号化序列。
进一步地,选取时间特征参数作为计算参数,则时间序列数据表示为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十九研究所,未经中国电子科技集团公司第二十九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910525678.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种查询区块链上评论数据的方法及其设备
- 下一篇:事件脉络生成方法及装置