[发明专利]面向空气质量预报的样本优化方法有效
申请号: | 201210228817.5 | 申请日: | 2012-07-03 |
公开(公告)号: | CN102799772A | 公开(公告)日: | 2012-11-28 |
发明(设计)人: | 刘永红;余志;徐伟嘉;蔡铭;朱倩茹 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 空气质量 预报 样本 优化 方法 | ||
技术领域
本发明属于环境预测领域,特别是空气质量预测领域。
背景技术
从20世纪90年代起,人工神经网络开始应用于空气质量预测领域。人工神经网络在空气质量预报过程中起到数据驱动的作用。由输入层神经元通过神经网络结构计算并得出输出层神经元。神经网络结构通过历史数据的学习过程来调整并最终确定。
随着预报精度要求的不断提高,对神经网络的使用与改进研究也在逐步发展。BP神经网络是一种利用误差反向传播算法的人工神经网络,通过不断重复前向传播和后向传播过程,直至各个训练模式满足结束条件,则学习结束,从而利用完成学习后的网络结构,根据预测日输入神经元信息得出预测结果。
从模型建立的层面上看,影响神经网络学习和泛化能力的因素主要有三个:网络拓扑结构、学习算法和学习样本。在对预报方法的改进方面主要集中在网络结构和学习算法上,许多学者都做了不少研究,在一定程度上提高了网络的预测精度,取得了一定的成果。但当网络结构和学习算法的改进达到一定程度后对空气质量预报模型预测精确度的提高就有所限制。所以在对网络结构和学习算法改进之外,学习样本的选择便成为决定网络映射及泛化能力的最终因素。因为,学习样本的选择,使学习样本具有代表性,可以去除不必要干扰,达到优种优产的目的。从物理角度讲,影响大气污染物扩散与输送的主要因素为气象条件,建立基于气象相似准则的样本优化方法成为首要选择,因为不同气象因子对污染物浓度有着不同的影响,气象因子间的相互作用、综合形成的气象环境对污染物亦有着不同影响,造成气象变化规律与污染物浓度间不恒定的对应关系。多元的气象因素塑造多样的气象空间,不同的气象空间对污染物的传输及扩散有着不同的影响。气象空间的相似性对污染物浓度的变化有着规律性的参考。在进行空气质量预报时,若寻得合适的气象空间,多个物理量与污染物间的内在关系便有了参考。针对主要影响因素选择合适的样本集,使预报工作更具有针对性,提高了网络映射及泛化能力,最终可达到提高空气质量预报精确度的目的。
发明内容
本发明解决的技术问题是提供一种预报精度高的、自适应性好针对性强的面向空气质量预报的样本优化方法。
为解决上述技术问题,本发明采用的技术方案是:提供一种面向空气质量预报的样本优化方法,其特征是,包括以下步骤:
(1)确定样本优化筛选的相关参数,其具体是:
(11)采用污染物浓度与气象因子综合分析法确定气象因子权重矩阵,其具体是:
(111)获取污染物上升与下降情景下气象因子权重值;
(112)获取污染物严重与轻微情景下气象因子权重值;
(113)计算污染物质量浓度与气象因子的相关系数;
(114)计算每一个气象因子的初始权重值,建立权重矩阵;
(12)采用正交实验法确定阈值矩阵;
(13)确定样本量;
(2)筛选出优化的样本,其具体是:
(21)筛选出每一气象相似度达到阈值范围内的样本;
(22)筛选出总体气象相似度达到阈值范围内的样本;
(23)筛选出与预测日气象背景相似度最高的样本。
所述步骤(111)的具体步骤是:
(1111)获取情景一下气象因子代表数据,即为污染物今日浓度与昨日浓度对比的升降值分别在0.05mg/m3以上及-0.05mg/m3以下的两个时期中各气象因子的均值和分析时段内该气象因子的最大值、最小值及平均值,即上升时期平均值 、下降时期平均值及分析时段的最大值、最小值及平均值,其中为气象因子标签;
(1112)数值归一化处理,运用下式处理,
,,;
(1113)计算气象因子变化度,;
(1114)计算权重值,,其中为气象因子变化度,为气象因子种类数。
所述步骤(112)的具体步骤是:
(1121)获取情景二下气象因子代表数据,即为污染物的API值分别在100以上及20以下的两个时期内各气象因子的均值和分析时段内该气象因子的最大值、最小值及平均值,即污染严重时期平均值、污染轻微时期平均值及分析时段的最大值、最小值及平均值,其中为气象因子标签;
(1122)数值归一化处理,运用下式处理,
,,;
(1123)计算气象因子变化度,;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210228817.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用