[发明专利]时间序列数据处理方法、装置、可读介质及电子设备在审
申请号: | 202111033394.7 | 申请日: | 2021-09-03 |
公开(公告)号: | CN113743618A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 任磊;莫廷钰;成学军 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 董涛 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间 序列 数据处理 方法 装置 可读 介质 电子设备 | ||
本发明公开了一种时间序列数据处理方法、装置、可读介质及电子设备,所述方法包括:获取第一时间序列数据和第二时间序列数据,其中,所述第一时间序列数据包括预设标签信息,所述第二时间序列数据为无标签的时间序列数据;对所述第二时间序列数据添加伪标签信息,以得到包括伪标签信息的第三时间序列数据;基于所述第一时间序列数据和所述第三时间序列数据进行模型训练,以得到时间序列分类模型。综上,本发明将有标签信息的时间序列数据,为无标签信息的时间序列数据添加伪标签信息,进而将两者时间序列数据作为模型训练的样本数据,使时序数据集多样化,使得训练的时序分类模型具有更强的泛化能力,提高时序分类模型的鲁棒性与分类准确性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种时间序列数据处理方法、装置、可读介质及电子设备。
背景技术
深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,其可以学习样本数据的内在规律和表示层次,从而挖掘数据相关问题,再解决数据相关问题。例如,深度学习可以有效改善时间序列的问题,比如时间序列分类、时间序列预测、时间序列异常检测。但是,利用深度学习解决前述问题时候,需要足够的数据样本,且对数据样本的质量也有一定的要求,如果数据样本不足,和/或者数据噪声较多,深度学习得到的相关模型将会不稳定,再者,由传感器采集大量的原始数据,多为无标签样本,该部分数据价值很难得到充分利用,此外,无标签样本可能分布与有标签样本不同,如果直接采用伪标签样本的方式,可能导致无法适合于相关应用场景。综上,相关技术中,如何获得足够、有效的数据样本是深度学习领域的难题之一,如果没有足够、有效的数据样本,训练除的模型泛化能力很难得到提升。
发明内容
本发明提供一种时间序列数据处理方法、装置、可读介质及电子设备,可以使时序数据集多样化,使得训练的时序分类模型具有更强的泛化能力,提高时序分类模型的鲁棒性与分类准确性。
第一方面,本发明提供了一种时间序列数据处理方法,包括:
获取第一时间序列数据和第二时间序列数据,其中,所述第一时间序列数据包括预设标签信息,所述第二时间序列数据为无标签的时间序列数据;
对所述第二时间序列数据添加伪标签信息,以得到包括伪标签信息的第三时间序列数据;
基于所述第一时间序列数据和所述第三时间序列数据进行模型训练,以得到时间序列分类模型。
第二方面,本发明提供了一种时间序列数据处理装置,包括:
数据获取模块,用于获取第一时间序列数据和第二时间序列数据,其中,所述第一时间序列数据包括预设标签信息,所述第二时间序列数据为无标签的时间序列数据;
标签处理模块,用于对所述第二时间序列数据添加伪标签信息,以得到包括伪标签信息的第三时间序列数据;
第一训练模块,用于基于所述第一时间序列数据和所述第三时间序列数据进行模型训练,以得到时间序列分类模型。
第三方面,本发明提供了可读介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如第一方面所述的方法。
第四方面,本发明提供了电子设备,包括:处理器、存储器和总线;所述存储器用于存储执行指令,所述处理器与所述存储器通过所述总线连接,当所述电子设备运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述处理器执行如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111033394.7/2.html,转载请声明来源钻瓜专利网。