[发明专利]基于经验模态分解和前馈神经网络对时序数据的预测方法有效
申请号: | 202010230486.3 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111428201B | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 姚若侠;刘云鹤 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06F17/16;G06N3/0499 |
代理公司: | 西安永生专利代理有限责任公司 61201 | 代理人: | 申忠才 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 经验 分解 神经网络 时序 数据 预测 方法 | ||
一种基于经验模态分解和前馈神经网络对时序数据的预测方法,由对数据集缺失值处理、独热编码处理、主成分分析方法降维、经验模态分解、数据标准化处理、前馈神经网络训练、对测试集测试步骤组成。本发明采用了主成分分析方法降维和经验模态分解方法,通过降维减少预测变量的个数,得到的数据包含了原始数据的大部分信息,保证降维后得到的数据中每个变量不包含重复的原始数据信息,在前馈神经网络训练时,用本征模函数代替原始时序数据进行训练,输入降维后的数据集,减少了变量个数,获得了准确的结果,训练时间大幅度减少,可用于对时序数据预测。
技术领域
本发明属于时序数据预测的领域,具体涉及EMD分解、PCA降维和BP神经网络训练等方法。
背景技术
目前已经有很多方法可用于对时序数据进行预测,比如向量自回归模型、自回归滑动平均模型、自回归积分滑动平均模型,以及基于回归的方法线性支持向量回归。这些模型经常假设时间序列有确定的分布或函数形式,但是不能获取复杂潜在的非线性关系。其他模型,如高斯过程需要较高的计算成本来处理大尺度的数据。
目前从实际生活中记录的时序数据大都是没有任何函数特性的数据,直接将这些数据输入神经网络进行训练,得不到最优的训练模型,消耗了大量的时间,用现有的时序数据预测方法进行预测,只能预测到后面的一两个点,得不到满意的预测效果。
发明内容
本发明所要解决的预测问题在于克服上述现有预测方法的不足,提供一种预测结果准确、处理数据速度快、精度高的基于经验模态分解和前馈神经网络对时序数据的预测方法。
解决上述技术问题所采用的技术方案由下述步骤组成:
(1)对数据集缺失值处理
将时序数据集Ab的缺失值进行统计并查找其位置,缺失值超过3个连续出现时,删除包含该缺失值的行,缺失值的位置连续数为1~3时,用缺失值插补法中的均值插补法进行缺失值填充,得到时序数据集A{A1,A2,A3},其中A1{x1,x2,...,xm|xi=(xi1,xi2,…,xiq)T,i为有限正整数;q为数据集A的样本个数}为数据集中的类别变量,A2{y1,y2,…,yn|yj=(yj1,yj2,…,yjq)T,j为有限正整数}为数据集中除去类别变量和待预测时序数据的其它变量,A3{z1,z2,…,zp|zl=(zl1,zl2,…,zlq)T,l为有限正整数}为数据集中需要预测的时序数据。
(2)独热编码处理
对数据集中的类别变量A1,进行独热编码方法处理,统计类别变量A1中每一个类别变量xi的类别值个数,用连续自然数从1开始对类别变量xi的类别值进行代替,自然数的个数为类别变量值的个数,再进行独热编码处理,将类别变量A1转换成二进制编码矩阵B{B1,B2,…,Bm|Bi为类别变量xi独热编码得到的数据}。
(3)主成分分析方法降维
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010230486.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无人驾驶清洁车
- 下一篇:智能菜谱推荐方法、装置、系统及冰箱