[发明专利]基于深度学习混合CNN-LSTM模型的台风预测方法有效

申请号：	201910278781.3	申请日：	2019-04-09
公开（公告）号：	CN109902885B	公开（公告）日：	2020-01-07
发明（设计）人：	汪祥;陈睿;张卫民;李金才;李小勇;朱啸宇	申请（专利权）人：	中国人民解放军国防科技大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G01W1/10;G06N3/04
代理公司：	43226 长沙中科启明知识产权代理事务所(普通合伙)	代理人：	任合明
地址：	410003 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	台风预测数据集构建变量数据训练模型台风热带气旋预测结果最佳路径准确度有效地再利用海洋准确率预测拟合学习全球
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习混合CNN-LSTM模型的台风预测方法，其特征在于包括以下步骤：

第一步，获取热带气旋最佳路径数据集，选择热带气旋最佳路径记录，匹配记录对应的大气海洋变量数据，构建训练模型所需的数据集，方法是：

1.1从热带气旋官方网站下载历史热带气旋最佳路径数据集，选择热带气旋最佳路径数据集中按热带气旋生成海区进行划分的区域的热带气旋最佳路径数据集，热带气旋最佳路径数据集的元素为热带气旋最佳路径记录；每一个区域热带气旋最佳路径数据集中包括不同年份的热带气旋最佳路径记录，每一年又包括不同条数的热带气旋最佳路径记录，单条热带气旋最佳路径记录含该热带气旋从形成到消亡的全部时间、经纬度位置以及强度信息；

1.2令需要预测台风的某一固定区域为区域A₁，A₁的热带气旋最佳路径数据集为Q，逐一检查Q中单条热带气旋最佳路径上的最大强度是否达到64kt，将最大强度达到64kt的单条热带气旋记录即台风记录放至台风数据集Q₁，将最大强度达到34kt未达到64kt的热带气旋单条记录即热带风暴记录放至热带风暴数据集Q₂，由此构造出台风数据集Q₁、热带风暴数据集Q₂，其余不满足条件的记录均舍去；

1.3下载Q₁中全部台风记录所有时刻记录点的时间、经纬度位置，采用大气海洋变量数据集生成方法，根据Q₁中全部台风记录所有时刻记录点的时间、中心经纬度位置进行组织，得到模型训练所需的Q₁相对应的大气海洋变量数据集方法是：

1.3.1将Q₁中的台风记录进行随机排序，令N₁为Q₁的台风记录个数，初始化台风记录序号n_p＝1；

1.3.2令为第n_p条台风记录的记录点个数，初始化第n_p条台风记录的记录点序号

1.3.3根据第n_p条台风记录的第个记录点的时间经度位置纬度位置采用单点变量数据下载方法从天气预报中心网站下载第n_p条台风记录的第个记录点相对应的大气变量数据X^P以及海洋变量数据X^S，将X^P及X^S打包组成第n_p条台风记录的第个记录点的时间和经纬度相应的大气海洋变量数据，记为为第n_p条台风记录的第个记录点的时间，为第n_p条台风记录的第个记录点的经度，为第n_p条台风记录的第个记录点的纬度；

1.3.4令

1.3.5若n_p≤N₁且转步骤1.3.3；若n_p≤N₁但令n_p＝n_p+1，转步骤1.3.2；若n_p＞N₁，执行步骤1.3.6；

1.3.6将打包组成为一个数据集，即为Q₁相对应的大气海洋变量数据集含N₁条台风所有记录点对应的大气海洋变量数据；

1.4下载Q₂全部热带风暴记录所有时刻记录点的时间、中心经纬度位置，采用步骤1.3所述大气海洋变量数据集生成方法，根据Q₂全部热带风暴记录所有时刻记录点的时间、经纬度位置进行组织，得到模型训练所需的Q₂相对应的大气海洋变量数据集

1.5根据Q₁，Q₂以及针对不同的预测目标构建训练不同预测模型的数据集，方法是：

1.5.1若预测目标是台风是否形成，构建训练台风是否形成预测模型所需的数据集R₁，方法是：

1.5.1.1根据Q₁以及构建训练模型的所需的数据集R₁₁，R₁₁中含有利用Q₁中所有台风记录针对训练模型所构建的输入数据集和利用Q₁中所有台风记录针对训练模型所构建的标签数据集，输入数据集中含有M₁个输入数据，标签数据集中含有M₁个标签数据，M₁个输入数据为M₁≤N₁，1≤q≤M₁，将M₁个输入数据均打上标签1，即为标签数据集；

1.5.1.2根据Q₂以及构建训练模型的所需的数据集R₁₂，R₁₂中含有利用Q₂中所有热带风暴记录针对训练模型所构建的输入数据集和利用Q₂中所有热带风暴针对训练模型所构建的标签数据集，输入数据集中含有M₂个输入数据，标签数据集中含有M₂个标签数据，M₂个输入数据为M₂≤N₂，1≤h≤M₂，N₂为Q₂的热带风暴记录个数，将M₂个输入数据均打上标签1，即为标签数据集；

1.5.1.3将R₁₁和R₁₂合并为训练台风是否形成预测模型所需的数据集R₁，R₁含模型所需的I₁个输入数据，I₁个标签数据，I₁＝M₁+M₂；转步骤1.6；

1.5.2若预测目标是台风路径，对Q₁中所有台风记录的经纬度值和对应的大气海洋变量数据进行错位处理，构建训练台风路径预测模型所需的数据集R₂，R₂中含有利用Q₁中所有台风记录针对训练模型所构建的路径输入数据集和利用Q₁中所有台风记录针对训练模型所构建的路径标签数据集，路径输入数据集中含有I₂个输入数据，I₂个输入数据为1≤i_p≤I₂，路径标签数据集中含有I₂个标签数据，I₂个标签数据为b为回顾时间步，路径标签数据即为经纬度值；转步骤1.6；

1.5.3若预测目标是台风强度，对Q₁中所有台风记录的强度值和对应的大气海洋变量数据进行错位处理，构建训练台风强度预测模型所需的数据集R₃，R₃中含有利用Q₁中所有台风记录针对训练模型所构建的强度输入数据集和利用Q₁中所有台风记录针对训练模型所构建的强度标签数据集，强度输入数据集中含有I₂个强度输入数据，I₂个强度输入数据为1≤i_p≤I₂，强度标签数据集中含有I₂个标签数据，I₂个标签数据为b为回顾时间步，强度标签数据即为强度值；转步骤1.6；

1.6对R₁，R₂，R₃进行预处理：分别对R₁的输入数据集、R₂的输入数据集和R₂的标签数据集，R₃的输入数据集和R₃的标签数据集按公式(1)进行归一化，

其中R表示R₁，R₂，R₃中任何一个数据集的输入数据集或R₂，R₃中任何一个数据集的标签数据集，R_max表示该数据集的最大值，R_min表示该数据集的最小值；R₁，R₂，R₃预处理后的数据集分别为R′₁，R′₂，R′₃；

第二步，构建深度学习混合CNN-LSTM模型，方法是：

2.1搭建深度学习环境：在服务器上安装基于Python的深度学习库Keras，并使用Google深度学习框架TensorFlow作为后端；

2.2基于Python的深度学习库Keras构建深度学习混合CNN-LSTM台风预测模型，方法是：

2.2.1构建混合CNN-LSTM模型中学习大气变量空间特征的3DCNN模块：将3DCNN模块中神经网络的结构设定为1层Keras的输入层，m_A层三维卷积层，m_A层批正则化层，1层平铺层，1层全连接层；设定第1层三维卷积层含个的3维卷积核，卷积核的尺寸为步长为设定第2层三维卷积层含个的3维卷积核，卷积核的尺寸为步长为设定第m_A层三维卷积层含个的3维卷积核，卷积核的尺寸为步长为每层三维卷积层后添加一层批正则化层；设定全连接层的神经元数目为d_A个，其中参数d_A均为正整数；

2.2.2构建混合CNN-LSTM模型中学习海洋变量空间特征的2DCNN模块：将2DCNN模块中神经网络的结构设定为1层Keras的输入层，m_B层二维卷积层，m_B层批正则化，1层平铺层和1层全连接层组成；设定第1层二维卷积层含个的2D卷积核，卷积核的尺寸为步长为设定第2层二维卷积层含个的2D卷积核，卷积核的尺寸为步长为每层二维卷，...，设定第m_B层二维卷积层含个的2D卷积核，卷积核的尺寸为步长为每层二维卷积层后加一层批正则化层；设定全连接层的神经元数目为d_B个，其中d_B均为正整数；

2.2.3构建混合CNN-LSTM模型中学习时序特征的LSTM模块：设定LSTM模块中神经网络的结构为1层Keras的LSTM层，设置LSTM的神经元个数为d_C个；

2.2.4将3DCNN模块，2DCNN模块，LSTM模块通过用Keras内置的Sequential顺序模块连接，并添加一层输出层，设定输出层神经元个数为1，连接后的模型即为混合CNN-LSTM模型；其中，3DCNN模块的输入为R′₁，R′₂，R′₃中输入数据集的大气变量数据，输出为大气空间特征向量O^P，大气空间特征向量O^P向量长度为全连接层的神经元数目d_A；2DCNN模块的输入为R′₁，R′₂，R′₃中输入数据集的海洋变量数据，输出为大气空间特征向量O^S，大气空间特征向量O^S向量长度为全连接层的神经元数目d_B；LSTM模块的输入为3DCNN模块和2DCNN模块输出向量的合并向量O＝[O^P，O^S]，合并向量O是由Keras的合并层合并得来，O的长度为d_A+d_B；LSTM模块的输出为1个输出映射值；

第三步，通过所构建的数据集训练混合CNN-LSTM模型来拟合得到台风是否形成预测模型、台风路径预测模型、台风强度预测模型，方法是：

3.1根据需求在输入数据和标签数据一一对应的前提下将R′₁，R′₂，R′₃中的数据随机打乱，按a′∶b′的比例划分为训练集R′₁₁，R′₂₁，R′₃₁和测试集R′₁₂，R′₂₂，R′₃₂，其中a′，b′为正整数且a′≥b′；R′₁₁含N_F个输入数据和标签数据，R′₁₂含N_F′个输入数据和标签数据；

R′₂₁含N_L个输入数据和标签数据，R′₂₂含N_L′个输入数据和标签数据；

R′₃₁含N_L个输入数据和标签数据，R′₃₂含N_L′个输入数据和标签数据；

3.2利用R′₁训练混合CNN-LSTM模型从而拟合得到台风是否形成预测模型，方法如下：

3.2.1选择交叉熵函数作为混合CNN-LSTM模型的损失函数，函数形式如下：

其中，损失函数值为loss_value1，N_F为R′₁₁的输入数据或标签数据的总个数，i_F为R′₁₁中数据的序号，1≤i_F≤N_F，为R′₁₁中第i_F个真实的标签数据，为模型预测的标签数据，表示对取对数；

3.2.2选择准确率ACC作为模型好坏的评价指标：

其中，N_A为R′₁₂中被模型预测正确的标签数据的总数，N_F′为R′₁₂的标签数据总数；

3.2.3将R′₁输入混合CNN-LSTM模型，对混合CNN-LSTM模型进行训练，拟合得到台风是否形成预测模型，模型的损失函数为交叉熵函数，评价指标为ACC；

3.3利用R′₂训练混合CNN-LSTM模型，拟合得到台风路径预测模型，方法如下：

3.3.1选择均方根误差函数作为台风路径预测模型的损失函数：

其中，损失函数值为loss_value2，N_L为R′₂₁的输入数据或标签数据的总个数，i_L为R′₂₁中数据的序号，1≤i_L≤N_L，为R′₂₁中第i_L个真实的标签数据，为第i_L个模型预测的标签数据；

3.3.2选择绝对误差函数作为台风路径预测模型的评价指标：

其中，N′_L为R′₂₂的输入数据或标签数据的总个数，i′_L为R′₂₂中数据的序号，1≤i′_L≤N′_L，为R′₂₂中第i′_L个真实的标签数据，为第i′_L个模型预测的标签数据；

3.3.3将R′₂输入混合CNN-LSTM模型，对混合CNN-LSTM模型进行训练，拟合得到台风路径预测模型，模型的损失函数为均方根误差函数，评价指标为绝对误差函数；

3.4利用R′₃训练混合CNN-LSTM模型，拟合得到台风强度预测模型：

3.4.1选择均方根误差函数作为台风强度预测模型的损失函数：

其中，损失函数值为loss_value3，N_L为R′₃₁的输入数据或标签数据的总个数，i_L为R′₃₁中数据的序号，1≤i_L≤N_L，为R′₃₁中第i_L个真实的标签数据，为第i_L个模型预测的标签数据；

3.4.2选择绝对误差函数作为台风强度预测模型的评价指标：

其中，N′_L为R′₃₂的输入数据或标签数据的总个数，i′_L为R′₃₂中数据的序号，1≤i′_L≤N′_L，为R′₃₂中第i′_L个真实的标签数据，为第i′_L个模型预测的标签数据；

3.4.3将R′₃输入混合CNN-LSTM模型，对混合CNN-LSTM模型进行训练，拟合得到台风强度预测模型，模型的损失函数为均方根误差函数，评价指标为绝对误差函数；第四步，利用三种台风预测模型进行预测，方法是

4.1令目标预测区域A的经纬度范围为U_A°×W_A°，U_A°为A的经度跨度，W_A°为A的纬度跨度，要求A与第一步选择的热带气旋记录所在区域属同一海区；选定下载的数据类型为A中已有的最高分辨率u_A°×u_A°的网格化大气海洋变量数据；因此，A内的总格点数G＝N×M，其中

4.2选定和训练模型时一致的预测时间步k，回顾时间步b；

4.3下载A内格点所对应的大气海洋变量数据后进行台风预测，方法是：

4.3.1以A的二维经纬度网格的第一个点为原点建立坐标，令原点为(1，1)；

4.3.2初始化纵坐标为变量n＝1；

4.3.3初始化横坐标为变量m＝1；

4.3.4采用下载格点大气海洋变量数据的方法下载坐标为(m，n)处格点的大气海洋变量数据X_[m，n]；方法是：根据预测的当前时刻t₁以及(m，n)处格点的经度位置lon_[m，n]，纬度位置lat_[m，n]采用步骤1.3.3所述的单点变量数据下载方法，从天气预报中心逐一下载t₁，t₁-6，t₁-12，...，t₁-6b时刻(m，n)处格点的大气海洋变量数据，分别记录为网格中每一个格点是一个五元组结构，五元组结构为(NUM，LOC，TT，X^P，X^S)，其中NUM是网格的坐标(m，n)，LOC是(m，n)处格点的经度值和纬度值，TT是一个时间的集合，含t₁，t₁-6，t₁-12，...，t₁-6b时刻的时间，X^P是(m，n)处格点TT各时刻的大气变量数据，X^S是(m，n)处格点TT各时刻的海洋变量数据，X^P与X^S合成后即为(m，n)处格点的大气海洋数据X_[m，n]；

4.3.5若n≤N且m≤M，将X_[m，n]输入至台风是否形成预测模型，预测(m，n)处格点6k小时后是否有台风形成；若预测结果是不形成，令m＝m+1，转步骤4.3.4；若预测结果是形成，转步骤4.3.6；若n≤N但m＞M，令n＝n+1，转步骤4.3.3；若n＞M，转第五步；

4.3.6初始化预测次序号变量n_f＝1；

4.3.7采用步骤4.3.4下载格点大气海洋变量数据的方法，根据实时更新的预测当前时刻t₂以及(m，n)处格点的经纬度位置重新下载数据得到X′_[m，n]，将得到的X′_[m，n]输入台风路径预测模型，得到第n_f次路径预测结果即为台风在t₂+6k×n_f时刻的经纬度位置；

4.3.8将X′_[m，n]输入台风强度预测模型，得到第n_f次强度预测结果即为台风在t₂+6k×n_f时刻的强度值；

4.3.9若不为0，根据预测得到的经纬度位置搜索与A中相同经纬度值对应的格点坐标(m′，n′)，令n_f＝n_f+1，转步骤4.3.7；若为0，n_f＝预测总次数NF，转步骤4.3.10；

4.3.10将n_f次台风路径预测的连接绘图后即为从t₂时刻起6k×n_f小时后的预测路径，n_f次台风强度预测的即为对应的路径上的台风强度值；

第五步，结束。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学，未经中国人民解放军国防科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910278781.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于主从博弈策略的虚拟电厂优化调度方法
下一篇：一种二维配电通信网网络流量预测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度学习混合CNN-LSTM模型的台风预测方法有效

专利文献下载