[发明专利]一种基于多层注意力机制的空气质量推断方法有效
申请号: | 202011563544.0 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112765229B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 韩启龙;张玉颖;宋洪涛;王也;李丽洁 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06F16/951;G01N33/00;G06N3/04;G06N3/08;G06Q10/06;G06Q50/26 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 注意力 机制 空气质量 推断 方法 | ||
1.一种基于多层注意力机制的空气质量推断方法,其特征在于,所述空气质量推断方法包括以下步骤:
S100、将城市划分为大小相同的网格区域,对于网格内没有部署空气质量监测传感器的区域划分为待推断区域,待推断区域的周围八个网格区域作为局部区域,已部署空气质量监测传感器的区域作为全局区域;
S200、获取影响空气质量数据相关的时序数据和非时序数据,所述获取影响空气质量数据相关的时序数据包括:历史空气质量数据、气象数据和天气预报数据,所述空气质量的非时序数据包括:城市的路网数据和城市兴趣点数据;
S300、对时序数据和非时序数据进行数据处理,对于时序数据,去除会影响模型推断能力的部分突变值,对于时序数据的缺失值采用滑动窗口进行填充,对于非时序数据的缺失值采用平均值进行填充;
S400、构建多层注意力机制神经网络模型,所述多层注意力机制神经网络模型包括混合注意力层、空间注意力层、融合层和推断层;
S500、将处理完的数据输入到多层注意力机制神经网络模型中,进行训练;
S600、对待推断区域进行推断,
其中,S400具体包括以下步骤:
S410、所述混合注意力层,该层包括时间注意力和全连接神经网络两个部分,对于时序数据,将其输入到LSTM中,并且通过注意力层对各个LSTM的不同的隐藏层进行加权作为最终时序数据的输出值;对于非时序数据,将其输入到全连接神经网络中,最后的输出和时间注意力的输入进行融合;
S420、所述空间注意力层,该层包括局部空间注意力层和全局空间注意力层,局部空间注意力层用于对局部空间区域特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对局部空间区域特征进行打分并且加权求和作为局部空间区域的特征;全局空间注意力层用于对已经部署空气监测站点区域的特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对全局空间区域进行打分并且加权求和作为全局空间区域的特征;
S430、所述融合层,该层将经过空间注意力层的局部空间特征和全局空间特征以及待推断区域的特征输入到全连接层;
S440、所述推断层,该层将融合层的数据作为空气质量推断的输入,将输出值也就是对该区域的空气质量推断值,通过损失函数得到与真实值的误差,将误差经过模型反向传播,不断迭代,调整模型参数,得到训练后的神经网络模型。
2.根据权利要求1所述的一种基于多层注意力机制的空气质量推断方法,其特征在于,S100具体包括以下步骤:
S110、将城市进行网格区域划分,将城市区域划分为边长为c的相互不相交的正方形网格Ri,每个网格区域的周围八个相邻的网格区域作为局部空间区域,其他已经部署传感器的区域作为全局区域;
S120、将每个网格区域的中心点的经纬度作为网格坐标,将所述网格坐标作为待推断的基本单元。
3.根据权利要求1所述的一种基于多层注意力机制的空气质量推断方法,其特征在于,S200具体包括以下步骤:
S210、采用爬虫程序定时对天气网的天气数据进行爬取,获得城市空气质量数据,将爬取得到的历史空气质量数据持久化存储到数据库中,记网格区域Ri的空气质量数据为
S220、用爬虫程序定时对中国天气网的天气数据进行爬取,获取城市的气象数据,将爬取得到的气象数据持久化至数据库存储,所述气象数据包括历史气象数据和实时气象数据,所述气象数据具体为:温度、湿度、风速以及风向,记历史时间网格区域Ri的气象数据为历史气象数据
S230、采用爬虫程序定时对天气网的天气数据进行爬取,获取天气预测数据,将爬取得到的天气预测数据持久化至数据库存储,记t时刻网格区域Ri天气预测数据为WFtRi;
S240、获取城市的路网结构数据,所述路网结构数据包括道路的条数、长度和类别,记网格区域Ri的路网结构数据为RoadRi;
S250、获取城市的兴趣点数据,所述兴趣点数据包括特定点的集合和属性集,所述集合包括学校、医院和商场,所述属性集包括名称、类别和坐标,记网格区域Ri的城市兴趣点数据为POIRi。
4.一种基于多层注意力机制的空气质量推断方法,其特征在于,所述空气质量推断方法包括以下步骤:
S100、将城市划分为大小相同的网格区域,对于网格内没有部署空气质量监测传感器的区域划分为待推断区域,待推断区域的周围八个网格区域作为局部区域,已部署空气质量监测传感器的区域作为全局区域;
S200、获取影响空气质量数据相关的时序数据和非时序数据,所述获取影响空气质量数据相关的时序数据包括:历史空气质量数据、气象数据和天气预报数据,所述空气质量的非时序数据包括:城市的路网数据和城市兴趣点数据;
S310、采用统计学中的pettitt算法,对空气质量中的时序突变值进行检测并且进行去除,采用相邻48小时的时间片的平均值进行填充;
S320、对于时序数据的缺失值,采用当前时刻当日的平均值进行填充;
S330、对于非时序数据的缺失值,采用所述非时序数据类型的众数进行填充;
S400、构建多层注意力机制神经网络模型,所述多层注意力机制神经网络模型包括混合注意力层、空间注意力层、融合层和推断层;
S500、将处理完的数据输入到多层注意力机制神经网络模型中,进行训练;
S600、对待推断区域进行推断,
其中,S400具体包括以下步骤:
S410、所述混合注意力层,该层包括时间注意力和全连接神经网络两个部分,对于时序数据,将其输入到LSTM中,并且通过注意力层对各个LSTM的不同的隐藏层进行加权作为最终时序数据的输出值;对于非时序数据,将其输入到全连接神经网络中,最后的输出和时间注意力的输入进行融合;
S420、所述空间注意力层,该层包括局部空间注意力层和全局空间注意力层,局部空间注意力层用于对局部空间区域特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对局部空间区域特征进行打分并且加权求和作为局部空间区域的特征;全局空间注意力层用于对已经部署空气监测站点区域的特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对全局空间区域进行打分并且加权求和作为全局空间区域的特征;
S430、所述融合层,该层将经过空间注意力层的局部空间特征和全局空间特征以及待推断区域的特征输入到全连接层;
S440、所述推断层,该层将融合层的数据作为空气质量推断的输入,将输出值也就是对该区域的空气质量推断值,通过损失函数得到与真实值的误差,将误差经过模型反向传播,不断迭代,调整模型参数,得到训练后的神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011563544.0/1.html,转载请声明来源钻瓜专利网。