[发明专利]一种基于数据特征片段的时间序列数据分类方法有效

专利信息
申请号: 201810843340.9 申请日: 2018-07-27
公开(公告)号: CN110019421B 公开(公告)日: 2023-09-01
发明(设计)人: 胡宇鹏;罗伟;李学庆;徐鹏涛;丁一明 申请(专利权)人: 山东大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/28
代理公司: 济南金迪知识产权代理有限公司 37219 代理人: 杨树云
地址: 250101 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 特征 片段 时间 序列 分类 方法
【说明书】:

发明涉及一种基于数据特征片段的时间序列数据分类方法,本发明先对具体时间序列训练集中的不同类别中的全体序列进行子类划分,同时选取相应的中心序列,并对每一个子类的中心序列再次利用数据趋势点,按照数据特征的权重排序,优先选择权重较大的数据特征片段,组成数据特征片段集合Shaplets,最后以Shaplets集合为核心,利用相应的Shapelets转换算法完成最终的时间序列分类。本发明极大地提高了Shapelets生成的效率,同时也提升了基于Shapelets进行时间序列分类的算法的整体处理效率。效率提升幅度在3个数量级以上。

技术领域

本发明涉及一种基于数据特征片段的时间序列数据分类方法,属于“海量”、“高维”时间序列数据挖掘技术领域。

背景技术

目前,随着互联网、物联网、云计算等技术的飞速发展,相关技术手段与相应的实现已经广泛应用于政务、金融、交通、医疗等领域。这些技术手段在推动信息社会飞速发展的同时也产生了海量的信息数据,即我们已逐步进入了“大数据”时代。在海量的信息数据中,有一类数据以“时间”为基准参考,不仅能够反映某个时刻的具体数据特性,而且能够反映某一段时间范围内数据的基本变化趋势,从而进一步揭示出:随着时间的连续性变化,相应数据实体的内在数据趋势特征及相应的数据规律,因此这一类数据被称为“时间序列”数据(time series data)。时间序列数据往往具有“海量”、“高维”、“持续产生”等特征,对其进行相应的数据分析与数据挖掘研究往往具有很大的挑战性,因此,时间序列数据挖掘研究问题被认为是本世纪十大数据挖掘挑战性问题之一,从而受到了学术界与工业界的广泛关注。

时间序列分类问题(time series classification)一直是时间序列数据挖掘研究领域的热点问题,时间序列分类着眼于序列的整体数据特征,即:如果将一个未标识的时间序列正确划分到预定义的一个数据类别(类别标签一般远大于2)中,此外在分类算法运行完成以后,领域专家除了希望快速获取相对准确的分类结果之外,还希望能够得到对于分类结果的合理解释。例如:对具体设备的运行状态的时间序列数据进行分类时,当该设备被划分到异常运行状态,相关专家希望知道完成相应分类的依据是什么,即具体是根据什么样的数据特征,进行相应的分类操作,简而言之,分类算法在实现快速、准确分类的基础上,需要能够提供相应的可解释性依据。针对时间序列数据分类问题,相关研究者分别从时序特征、距离测算、时域频域转换等多个方法,提出了大量的时间序列分类算法,而根据2017年底的时间序列分类问题的最新研究综述表明,基于时序特征,尤其是基于时序片段数据特征(Shapelets)进行相应的分类运算,该算法不仅能够获得比其他分类算法更高的分类精度,而且基于Shapelets的分类器还可以进一步给出相应分类结果的解释性依据。

目前基于数据特征片段进行数据分类的算法主要有以下三类:

●Shapelet发现算法(Shapelets Discovery,SD)

●Shaplets变换算法(Shapelets Transformation,ST)

●Shaplets学习算法(Shapelets Learning,SL)

这三种方法均有各自的特点,在准确率方面:SD算法的分类精度明显低于ST和SL,ST算法与SL算法的分类精度几乎处于同一水平。在算法时间复杂度方面:SD的时间复杂度最低,SL次之,ST的时间复杂度最高。在算法的空间复杂度方面:ST需要的训练空间最小,SD次之,SL所需要的训练空间最大。此外,根据时间序列分类算法的最新研究成果表明,基于数据特征片段(Shapelets)的分类方法还可以与其他的分类算法相结合,即:组合的分类方法(ensemble TSC)比如COTE方法将Shapelets分类与时域频域转换的分类算法以及其他时序分类算法相结合,从多个不同的角度获得相应的数据分类结果,并再次利用“投票”机制得到更加精确的结果。如下表1所示:

表1

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810843340.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top