[发明专利]一种基于数据增强的神经网络时间序列分类方法在审
申请号: | 202110179057.2 | 申请日: | 2021-02-09 |
公开(公告)号: | CN113035361A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 王天;张婷;刘兆英;李玉鑑 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N3/04;G06K9/62;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 增强 神经网络 时间 序列 分类 方法 | ||
本发明公开了一种基于数据增强的神经网络时间序列分类方法,首先,对时间序列数据集进行预处理;其次,选择合适的参数α对训练数据进行Mixup数据增强,增强后的数据用于模型训练;接着,构建LSTM‑FCN时间序列分类网络模型;最后,以交叉熵函数作为损失函数,使用反向传播和梯度下降算法Adam训练LSTM‑FCN网络。本发明的基于数据增强的时间序列分类方法有效提高了神经网络的时间序列分类性能。
技术领域
本发明属于时间序列分类领域,尤其涉及一种基于数据增强的神经网络时间序列分类方法。
背景技术
时间序列数据广泛地存在于生产生活中,例如股票的走向趋势、天气的温度、患者的心电图等,分析这些时序数据,并从中挖掘出重要信息对指导人们生产生活具有重大意义。时间序列分类是时间序列问题中比较重要且具有挑战性的任务,传统的时间序列分类方法,往往依靠人工设计特征,计算过程繁琐且时间复杂度高。而基于深度学习的方法,则需要大量的训练数据保证模型的泛化能力,以避免过拟合和欠拟合,这种方法在数据量小的情况下,难以发挥作用。
目前时间序列分类方法大致可分为基于距离的方法、基于特征的方法和基于深度学习的方法。基于距离的方法以欧氏距离或动态时间规整距离等,使用最近邻分类器以距离关系做分类;基于特征的方法,通过人工设计以形状,频率,统计学参数等作为特征,训练分类模型(如支持向量机、随机森林等);基于深度学习的方法,通过设计神经网络结构,直接输入原始数据训练模型,实现了端到端的训练过程。为了训练出高准确率的模型,深度学习方法通常需要大量数据,但在现实世界中很难获取充足的数据集供模型使用,因此存在一定局限性。
数据增强作为一种有效提高模型泛化能力、提升模型分类精度的技术手段,已经被广泛应用于深度学习模型的训练过程中。该技术通过对数据进行一定变换,得到新数据,这些新数据可作为对原始数据集的补充,帮助模型训练,提高模型性能。本发明利用Mixup数据增强技术训练神经网络模型,可有效提高网络模型性能,提高分类准确率;本发明可操作性,通用性较强,适用于各种基于深度学习的时间序列分类模型。
发明内容
本发明要解决的技术问题是,提供一种基于数据增强的神经网络时间序列分类方法,克服训练数据集不足的问题。本发明通过Mixup数据增强技术扩展数据集,使训练好的神经网络模型更具鲁棒性,从而提高网络对时间序列数据的分类能力。
为实现上述目的,本发明采用如下的技术方案:
一种基于数据增强的神经网络时间序列分类方法,包括以下步骤:
步骤1:对包含N个样本的时间序列数据集D={(x1,y1),(x2,y2),...,(xN,yN)}进行预处理;预处理步骤包括:
步骤1.1:使用z-score标准化方法对时间序列数据集D进行标准化处理,标准化公式为:
其中,xi表示第i(1≤i≤N)个时间序列样本,μ表示时间序列样本均值,σ表示时间序列样本方差,xi′表示标准化后的第i(1≤i≤N)个时间序列样本;
步骤1.2:将时间序列样本类别标签yi(1≤i≤N)转换为独热编码y′i(1≤i≤N),其中,y′i为具有C个元素的一维向量,C为时间序列样本类别数量,转换公式为:
其中,j∈[0,C),且j属于整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110179057.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置