[发明专利]一种基于多维度二次特征提取的多任务学习的空气质量预测方法有效
申请号: | 202010581735.3 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111814956B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 韩启龙;门瑞;陈睿;宋洪涛;张可佳;李洪坤;张育怀;李一豪;肖世桐;李佳航 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q10/04;G06Q50/26;G01N33/00 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 孙莉莉 |
地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 二次 特征 提取 任务 学习 空气质量 预测 方法 | ||
1.一种基于多维度二次特征提取的多任务学习的空气质量预测方法,其特征在于:具体包括以下步骤:
步骤1、获取所有被预测站点Si的空气质量的数据集,其中,i=1,...,n,n表示站点个数;所述数据集包括气象数据集和污染物数据集;
步骤2、对获取到的数据集进行数据预处理,再按比例将预处理后的数据集分为训练集{TSi|i=1,...,n}和测试集{VSi|i=1,...,n};
步骤3、选取要预测的污染物P;
步骤4、依次对所有被预测站点Si建立多维度二次特征提取的卷积神经网络模型和长短期记忆网络模型,所述卷积神经网络模型和长短期记忆网络模型的输入均为训练集{TSi|i=1,...,n},将污染物P在多维度二次特征提取的卷积神经网络模型上预测得到的预测值作为多维度二次特征提取的卷积神经网络模型的输出,将污染物P在长短期记忆网络模型上预测得到的预测值作为长短期记忆网络模型的输出;其中,t表示时间,H表示滑动窗口大小;
步骤5、构建基于多维度二次特征提取的多任务学习模型,将所有站点的所述污染物P在多维度二次特征提取的卷积神经网络模型上预测得到的预测值和污染物P在长短期记忆网络模型上预测得到的预测值作为多任务学习模型的输入,输出即为污染物P的预测结果,从而得到了训练好的基于多维度二次特征提取的多任务学习模型;
步骤6、将测试集{VSi|i=1,...,n}输入到已经训练好的基于多维度二次特征提取的多任务学习模型中,输出为污染物P的预测值
在步骤4中,依次对所有被预测站点Si的污染物P进行污染物相关性分析,具体为:
步骤4.1:在横坐标为时间,纵坐标为污染物浓度值的同一平面直角坐标系中,对所述训练集{TSi|i=1,...,n}所对应的每个被预测站点{Si|i=1,...,n}中的每列污染物特征进行绘制折线图,通过分析不同折线的整体走势,初步排除掉与步骤3中选取的污染物P明显不相关的污染物特征,余下待判定具体相关性的污染物特征;
步骤4.2:计算步骤4.1中污染物特征与污染物P之间的皮尔逊相关系数,根据所求皮尔逊相关系数的值,对污染物特征与污染物P的相关性进行评级,得到对应六个等级{li|i=1,2,...,6}的污染物特征集{Ui|i=1,2,...,6},相关性为:l1≥l2≥l3≥l4≥l5≥l6;
所述多维度二次特征提取的卷积神经网络模型的学习过程为:
步骤4.3:将t时刻,被预测站点Si的污染物P的浓度值置于第一层卷积神经网络的中心位置A;
步骤4.4:将步骤4.2中相关性评级为l1的污染物特征集U1在t时刻的浓度值,放在最靠近A的位置;将相关性评级为l2的污染物特征集U2在t时刻的浓度值,放在第二靠近A的位置;以此类推,相关性评级为l6的污染物特征集U6在t时刻的浓度值,放在最远离A的位置;
步骤4.5:对于第一层卷积神经网络的每个位置污染物特征的浓度值将其取出作为第二层卷积神经网络的中心位置B,将该污染物特征P′所在被预测站点Sj在t时刻的风速风向温度湿度和压强特征放在临近B的八个位置,空位补零,其中,j=1,...,n;
步骤4.6:根据B所在被预测站点的地理位置,获取离中心位置B所在被预测站点欧氏距离相对较小的八个被预测站点,所述八个被预测站点的各自的中心位置放置各自站点相同污染物特征P′的浓度值,将相同污染物特征P′在t时刻的风速风向温度湿度和压强特征置于相对应被预测站点的中心位置的周围,空位补零,其中0≤k≤8;
步骤4.7:训练第二层卷积神经网络,其中卷积核w=3x3,步长为3,进行二次卷积操作,得到位于中心位置的污染物特征浓度值的下一时刻的浓度预测值从而学习到不同站点浓度值阳同污染物特征P′的气体流动相关性;
步骤4.8:将步骤4.7中训练得到的预测值返回到第一层卷积神经网络的对应位置上,这样逐步更新第一层卷积神经网络每个位置上的值;再用卷积神经网络训练,其中,w=3x3,步长为1,进行一次卷积操作后传入全连接层,得到位于中心位置的被预测站点Si的污染物P的浓度值的预测值从而能够提取不同站点不同气体与当前预测污染物的气体流动相关性;
步骤4.9:t后移一个时间单位,重复步骤4.3至步骤4.8共H次,得到被预测站点Si的污染物P的浓度值的预测值
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010581735.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:棒板组合式电解加工阴极系统及其加工方法
- 下一篇:一种电子产品清洁装置