[发明专利]一种基于注意力机制深度学习的混沌时间序列预测方法在审
申请号: | 202010031956.3 | 申请日: | 2020-01-11 |
公开(公告)号: | CN111260124A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 孙媛媛;王博林;张书晨;陈彦光 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/04;G06N3/08 |
代理公司: | 大连星海专利事务所有限公司 21208 | 代理人: | 王树本;徐雪莲 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 深度 学习 混沌 时间 序列 预测 方法 | ||
1.一种基于注意力机制深度学习的混沌时间序列预测方法,其特征在于包括以下步骤:
步骤1、构建混沌时间序列数据集,利用Lorenz系统和Rossler系统生成混沌时间序列数据,具体包括以下子步骤:
(a)Lorenz系统方程通过公式(1)进行描述,
式中,和表示对自变量时间t求导数,a,b,c是Lorenz系统参数常量,设置初始值为a=16,b=4,c=45.92,x,y,z表示Lorenz系统的状态,设置初始值为x(0)=y(0)=z(0)=1.0,用四阶Runge-Kutta法产生以Δt为时间间隔的混沌时间序列;
(b)为使Lorenz系统完全进入混沌状态,丢弃初始瞬态前1000个点;
(c)通过简单的交叉验证生成训练集和测试集,获得具有混沌特性的时间序列;
(d)Rossler系统方程通过公式(2)进行描述:
式中,和表示对自变量时间t求导数,x,y,z表示Rossler系统的状态,设置初始值为x(0)=y(0)=z(0)=1.0,,a,b,c是Rossler系统参数常量,设置初始值为a=0.2,b=0.2,c=5,用四阶Runge-Kutta法产生以Δt为时间间隔的混沌时间序列;
(e)舍弃掉瞬态,将前20000个点划为训练集,接着5000个点划为测试集;
步骤2、对混沌时间序列进行相空间重构,根据Takens定理进行相空间重构,对于d′维混沌吸引子的一维标量时间序列{x(i):1≤i≤n}都可以在拓扑结构不变情况下找到一个d维嵌入相空间,通过一维的混沌时间序列{x(i)}的不同延迟时间τ来构建d维相空间状态向量,d维相空间状态向量通过公式(3)进行描述:
Xi=(x(i),…,x(i+(d-1)τ),i=1,2,…,n-(d-1)τ (3)
式中,Xi表示相空间状态向量,x(i)表示标量时间序列,d表示嵌入维数,τ表示延迟时间,Takens定理证明找到合适的嵌入尺寸,如果延迟坐标的维数是动态系统的维数,则在该嵌入维数空间中恢复吸引子,吸引子在嵌入维空间中恢复,在重构空间的轨迹中,动力系统保持微分同胚性,设置嵌入维数d=5,延迟时间τ=1;
步骤3、使用LSTM神经网络模型训练混沌时间序列数据,LSTM神经网络模型将输入的历史时间序列数据编码成隐藏状态和细胞状态,通过门的设计,LSTM神经网络模型自适应地控制积累信息的强弱,其中每个细胞计算单元的计算过程通过公式(4)-(9)进行描述:
it=σ(Wi[ht-1,xt-1]+bi) (4)
ft=σ(Wf[ht-1,xt-1]+bf) (5)
ot=σ(Wo[ht-1,xt-1]+bo) (8)
ht=ot tanh(Ct) (9)
式中,it,ft,ot分别表示输入门、遗忘门和输出门,Ct表示细胞状态,Wi,Wf,Wo,WC分别表示控制每个门输出的权值矩阵,bi,bf,bC,bo分别表示it,ft,Ct,和ot的偏置量,Ct-1表示上一层的细胞,xt-1表示当前的输入,ht-1表示上层的隐藏层输出,σ为sigmoid函数,tanh为激活函数,h表示隐层输出;
步骤4、构建基于预测的注意力机制模型,随着输入混沌时间序列长度的增加,训练模型的隐藏层信息会丢失或者引入噪声干扰,预测网络的性能会迅速下降,这里使用注意力机制在所有时间步长上自适应选择相关的隐藏状态信息,具体地,基于先前的预测网络LSTM单元隐藏状态来计算时间t处每个隐藏状态的关注权重通过公式(10)-(12)进行描述:
式中,表示在进行tanh变换后得到的隐层状态,表示任一时刻的LSTM神经网络模型的隐层状态,Ww表示权重向量,bw表示偏置向量,V表示投影向量,tanh是激活函数,αti为注意力权重表示第i个隐藏状态对于预测的重要性,ct表示在注意力机制作用下的前后关系向量,是所有隐藏状态{h1,h2,…,hT}的加权和,设置LSTM神经网络模型隐层数T=11;
步骤5、构建离线训练模型:训练模型使用端到端的方式通过时间反向传播算法BPTT进行训练,损失函数使用均方根误差RMSE函数,设置学习率lr=0.01,选择Adam算法作为优化算法,训练优化的目标是使模型输出的逼近真实观测值(y1,y2,…,yn),均方根误差的计算,通过公式(13)进行描述:
式中,N为样本总数,t表示任一时刻样本,yt为第i个样本的预测值,为第i个样本的实际值;
步骤6、在线预测,具体包括以下子步骤:
(a)、将步骤1得到的测试混沌时间序列数据,通过步骤2相空间重构对数据进行处理;
(b)、通过步骤3使用LSTM神经网络模型对混沌时间序列进行预测,利用步骤4构建模型隐藏层的注意力机制模型;
(c)、在步骤5训练模型中优化好参数后,将所学得的参数迁移至预测模型,当预测一段长度为T的时间序列(x0,x1,…,xT-1)时,使用预测模型做间接多步预测,迭代地将模型预测的输出作为下一步模型的输入,最终得到长度为P预测序列
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010031956.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理