[发明专利]一种基于数据增强的神经网络时间序列分类方法在审

申请号：	202110179057.2	申请日：	2021-02-09
公开（公告）号：	CN113035361A	公开（公告）日：	2021-06-25
发明（设计）人：	王天;张婷;刘兆英;李玉鑑	申请（专利权）人：	北京工业大学
主分类号：	G16H50/70	分类号：	G16H50/70;G06N3/04;G06K9/62;G06N3/08
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	沈波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于数据增强神经网络时间序列分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于数据增强的神经网络时间序列分类方法，首先，对时间序列数据集进行预处理；其次，选择合适的参数α对训练数据进行Mixup数据增强，增强后的数据用于模型训练；接着，构建LSTM‑FCN时间序列分类网络模型；最后，以交叉熵函数作为损失函数，使用反向传播和梯度下降算法Adam训练LSTM‑FCN网络。本发明的基于数据增强的时间序列分类方法有效提高了神经网络的时间序列分类性能。

技术领域

本发明属于时间序列分类领域，尤其涉及一种基于数据增强的神经网络时间序列分类方法。

背景技术

时间序列数据广泛地存在于生产生活中，例如股票的走向趋势、天气的温度、患者的心电图等，分析这些时序数据，并从中挖掘出重要信息对指导人们生产生活具有重大意义。时间序列分类是时间序列问题中比较重要且具有挑战性的任务，传统的时间序列分类方法，往往依靠人工设计特征，计算过程繁琐且时间复杂度高。而基于深度学习的方法，则需要大量的训练数据保证模型的泛化能力，以避免过拟合和欠拟合，这种方法在数据量小的情况下，难以发挥作用。

目前时间序列分类方法大致可分为基于距离的方法、基于特征的方法和基于深度学习的方法。基于距离的方法以欧氏距离或动态时间规整距离等，使用最近邻分类器以距离关系做分类；基于特征的方法，通过人工设计以形状，频率，统计学参数等作为特征，训练分类模型(如支持向量机、随机森林等)；基于深度学习的方法，通过设计神经网络结构，直接输入原始数据训练模型，实现了端到端的训练过程。为了训练出高准确率的模型，深度学习方法通常需要大量数据，但在现实世界中很难获取充足的数据集供模型使用，因此存在一定局限性。

数据增强作为一种有效提高模型泛化能力、提升模型分类精度的技术手段，已经被广泛应用于深度学习模型的训练过程中。该技术通过对数据进行一定变换，得到新数据，这些新数据可作为对原始数据集的补充，帮助模型训练，提高模型性能。本发明利用Mixup数据增强技术训练神经网络模型，可有效提高网络模型性能，提高分类准确率；本发明可操作性，通用性较强，适用于各种基于深度学习的时间序列分类模型。

发明内容

本发明要解决的技术问题是，提供一种基于数据增强的神经网络时间序列分类方法，克服训练数据集不足的问题。本发明通过Mixup数据增强技术扩展数据集，使训练好的神经网络模型更具鲁棒性，从而提高网络对时间序列数据的分类能力。

为实现上述目的，本发明采用如下的技术方案：

一种基于数据增强的神经网络时间序列分类方法，包括以下步骤：

步骤1：对包含N个样本的时间序列数据集D＝{(x₁,y₁),(x₂,y₂),...,(x_N,y_N)}进行预处理；预处理步骤包括：

步骤1.1：使用z-score标准化方法对时间序列数据集D进行标准化处理，标准化公式为：

其中，x_i表示第i(1≤i≤N)个时间序列样本，μ表示时间序列样本均值，σ表示时间序列样本方差，x_i′表示标准化后的第i(1≤i≤N)个时间序列样本；

步骤1.2：将时间序列样本类别标签y_i(1≤i≤N)转换为独热编码y′_i(1≤i≤N)，其中，y′_i为具有C个元素的一维向量，C为时间序列样本类别数量，转换公式为：

其中，j∈[0,C)，且j属于整数；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】