[发明专利]一种基于多领域特征的城市空气质量等级预测方法在审
申请号: | 201410452557.9 | 申请日: | 2014-09-04 |
公开(公告)号: | CN104200103A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | 王敬昌;陈岭;赵江奇;袁翠丽;鲁东丽;李纺 | 申请(专利权)人: | 浙江鸿程计算机系统有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 无 | 代理人: | 无 |
地址: | 310053 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 领域 特征 城市 空气质量 等级 预测 方法 | ||
技术领域
本发明涉及一种城市AQI等级预测方法,尤其涉及一种基于多领域特征的空气质量监 测站点AQI等级预测方法。
背景技术
空气是地球上的生物赖以生存的物质,是必不可少的一种物质。环境空气质量与人们的 日常生活息息相关,同时也在城市环境综合评价中占有重要地位。但是随着人类文明和经济 的发展,空气污染越来越严重,如何改善空气质量、合理进行大气环境质量预测预警变得越 来越重要,根据空气质量预测,人们可以采取相应措施如带口罩,尽量避免外出等,保护自 己免受空气污染物的侵害。
传统的空气质量预测方法一般仅考虑把原始数据作为预测模型的特征,而原始数据并不 能充分体现数据的统计学特性,如集中趋势和离散趋势,这必然严重影响预测结果的准确性。 一些产生式模型,如马尔科夫模型很好地利用了大气压,温度,交通等特征,但由于产生式 模型的标记偏置和独立性假设等固有缺陷,导致预测准确率依旧不太理想;判别式模型,如 决策树、支持向量机等,的学习和计算过程比较复杂。而条件随机场既具有判别式模型的优 点,又具有产生式模型的优点,其考虑了上下文标记间的转移概率,以序列化形式进行全局 参数优化和解码。另一方面,传统的空气质量预测通常是对接下来一整天的空气质量进行预 测,这种粗粒度时间段的空气质量预测存在一个弊端,假设明天的空气质量预测结果是优, 表明对空气污染物较敏感的人群可以进行户外活动,而实际上某些时间段(如上午8:00-9: 00,下午5:00-6:00)的空气质量有可能是中度污染或者重度污染,对空气污染较敏感人 群在这些时间段不宜进行户外活动。因此,对接下来一天的空气质量进行细粒度时间段的预 测更为合理,为此设计一种基于多领域特征的城市空气质量等级预测方法是非常有必要的。
发明内容
本发明为克服上述的不足之处,本发明提出了一种基于多领域特征的城市空气质量等级 预测方法,该方法可以更准确地预测AQI等级,满足人们挑选空气质量较好的时间段进行 外出活动的需要。
本发明是通过以下技术方案达到上述目的:一种基于多领域特征的城市空气质量等级预 测方法,包括数据预处理阶段、训练阶段、预测阶段;
数据预处理阶段:
1)对影响空气质量的多个领域的数据进行采集;
2)把城市划分成不相交的网格,每个网格g内的空气污染物浓度相同;
3)网格g所在的城市有m个含有空气监测站点的网格,抽取这些网格对应的每小时的空间 特征和时间特征,每个小时可以生成m个训练样本;若历史数据跨越n个小时,则可以得 到n×m个训练样本;
训练阶段:
1)训练数据集的获得及特征函数的定义:过去k个时刻生成的k个向量构成训练特征向量 集Xt={X1,X2,...,Xk},其与过去k个时刻的AQI等级构成的标记序列Y={Y1,Y2,...,Yk}组 成训练数据集;特征函数包括状态特征函数和转移特征函数;
2)基于定义的特征函数,采用拟牛顿法的BFGS算法对训练数据集进行学习,估计出条件 随机场模型最优参数,得到最优模型并输出条件随机场模型;
预测阶段:
1)预测特征向量集的获得:要预测的每个时刻i生成一个特征向量Xi,n个时刻生成n个 向量Xf={X1,X2,...,Xn};
2)利用预测特征向量集Xf={X1,X2,...,Xn}作为输入序列,采用维特比算法结合训练阶段学 习得到的条件概率模型求得条件概率P(Y/Xf)最大的输出序列并输 出预测结果。
作为优选,所述的空间特征包括:交通相关特征Fi;时间特征包括:气象学相关特征 Fm、空气污染物相关特征
作为优选,所述的训练特征向量集或预测特征向量集中的向量包括交通相关特征Fi、 气象学相关特征空气污染物相关特征三类特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鸿程计算机系统有限公司;,未经浙江鸿程计算机系统有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410452557.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用