[发明专利]一种基于双层嵌套LSTM的超长多维时间序列分类方法在审
申请号: | 202310623774.9 | 申请日: | 2023-05-30 |
公开(公告)号: | CN116644378A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 曹斌;钱凤;侯晨煜 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F18/25 | 分类号: | G06F18/25;G06F18/241;G06N3/0442;A61B5/00;A61B5/349 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 陈升华 |
地址: | 310012 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双层 嵌套 lstm 超长 多维 时间 序列 分类 方法 | ||
本发明公开了一种基于双层嵌套LSTM的超长多维时间序列分类方法,包括:获取超长多维时间序列数据集;将输入层、由i个LSTM网络并联而合成的网络、LSTM网络、全连接层、Batch Normalization层、Softmax层进行串联,得到双层嵌套LSTM模型;将已知所属类别的时间序列作为训练数据输入双层嵌套LSTM模型进行分类训练;使用训练后的双层嵌套LSTM模型对未知所属类别的目标时间序列进行分类识别。本方法适用于各种实际应用场景中的超长多维时间序列,能够对采集自这些现实场景中的超长时间序列数据进行有效处理,且不会出现训练时间长、参数更新慢,甚至梯度消失等问题。
技术领域
本发明涉及时间序列的数据挖掘技术领域,具体涉及一种基于双层嵌套LSTM的超长多维时间序列分类方法。
背景技术
多维时间序列是指在一段时间内按照一定的时间间隔频率对所观测的客观对象的多个变量值进行采样而得到的一段数据序列,它如实地记录了所观测对象在各个测量时间点上的状态值,是所观测对象真实运行状态的客观反映。多维时间序列数据是实值型的序列数据,具有数据量大、数据维度高以及数据是不断更新的等特点。近十几年来,随着物联网(IOT)和大数据技术的蓬勃发展,也带来了数据的爆发式增长,其中,多维时间序列更是随着硬件设备的快速迭代迎来了其增长的黄金时代。现在,多维时间序列已经普遍存在于各行各业,包括医疗产业的心电图时间序列数据、金融产业的金融时间序列数据、交通运输业的交通指数时间序列数据等,通过深入研究各个行业中的多维时序数据,可以挖掘出这些数据中隐藏着的信息,再将这些挖掘出来的信息加以利用来指导各自行业进一步的发展。
目前,针对多维时间序列的分类问题,传统的解决方法主要包括基于距离的方法、基于特征的方法和基于集成学习的方法等。基于距离的方法,主要是先通过定义距离函数来计算两个时间序列间的相似性,然后根据每条时间序列实例与训练数据中距离最近的实例来区分所属的类,最后将该序列实例分类到相对应的类中。基于特征的方法,一般包括两个步骤:首先是设计特征表示方法将序列转换成一种特征向量,然后训练基于序列特征的分类器对序列进行分类。基于集成学习(Ensemble Learning)的方法是将不同的分类器组合成一个新的分类器,将神经网络作为集成学习的基分类器可以提高网络的泛化能力与分类的效果。上述的这些方法都需要对数据进行复杂的预处理,或者进行复杂且繁重的特征工程,特别是基于特征的方法。
深度学习作为当前机器学习中的一个主流领域,其凭借海量数据驱动,可以自动地获取到深层且抽象的特征表达,很多时候可以替代人工设计的特征。深度学习算法是一种端到端的算法,它属于表示学习的一种,只需要数据输入和对应的目标输出,在此过程中省去了人工特征提取工程,这是深度学习区别于传统算法的特点。如果使用人工进行特征提取,那么人工特征提取的优劣决定了分类的精度。人工进行提取的特征不仅简单而且还不稳定,这就会影响模型的质量,不能对时间序列数据进行有效的特征提取,因此,相较于传统算法,利用深度学习模型来对时间序列数据进行分类往往能够得到更优的性能。
由于多维时间序列数据是按照采样时刻的先后顺序依次排列,前后数据之间存在着较强的时间依赖关系,而且多维时间序列数据还表现出变量之间的相关性。数据矩阵前一行数据对应前一个时刻的采样值,后一行数据对应后一个时刻的采样值,交换某两行数据会导致当前序列所含信息发生变化;每个序列含有多个时间变量,每个变量表示序列的一个维度,多个维度组合成一个整体,增加或删除变量将会变成一个完全不同的序列;不同维度之间可能存在某种未知的线性或非线性相关性,不同类型的序列,其维度之间的相关关系可能不同,因此,这种相关关系亦是序列含有的重要信息。此外,在各种实际的工业应用场景中采集到的真实多维时间序列数据往往存在采样频率偏高的问题,采样频率越高,能够获取到的信息就越丰富,根据计算表达式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310623774.9/2.html,转载请声明来源钻瓜专利网。