[发明专利]一种基于主动学习和克里金插值的空气质量推测算法在审
申请号: | 201811468938.0 | 申请日: | 2018-12-04 |
公开(公告)号: | CN109753631A | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 於志文;常慧娟;郭斌;王亮 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F17/17 | 分类号: | G06F17/17;G06F17/16;G06F17/18 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于主动学习和克里金插值的空气质量推测算法,该方法通过克里金插值预估所插数据的误差,提出基于置信度的计算方法,寻找对模型置信度最大的位置对空气质量优先采样,经过采样融合后准确推测其他位置的空气质量,以更加全面地利用空气监测站数据预测空气质量,并更好的了解城市空气质量的走势,进一步地为市政人员后期针对性地控制大气污染提供更好的依据。 | ||
搜索关键词: | 金插 主动学习 置信度 采样 算法 预估 数据预测 监测站 走势 市政 融合 | ||
【主权项】:
1.一种基于主动学习和克里金插值的空气质量推测算法,其特征在于步骤如下:步骤1:利用空气质量监测站收集空气中各污染物浓度信息数据,将数据整理成四元组<监测站id,监测站位置,检测时间,空气质量指数>的格式;原始数据表示为(station_id,time,PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Conc entration,O3_Concentration,SO2_Concentration),其中station_id代表监测站id,time代表所监测的污染物浓度信息的时间,(PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Concentration,O3_Concentration,SO2_Concentration)代表空气中悬浮颗粒物,二氧化氮,一氧化碳,臭氧,二氧化硫污染物浓度;步骤2:分别针对五种空气污染物浓度数据使用公式计算得到5个I值,取最大的I值为空气质量指数,即AQI;C为污染物浓度;Cl、Ch为该污染物浓度限值,Il、Ih为对应的AQI限值,4个数均为常量,可通过查阅空气质量指数及对应的污染物浓度限值表获得;表1空气质量指数及对应的污染物浓度限值步骤3:计算各空气监测站距离之间的半方差,衡量各监测站之间的空间相关程度即半变异函数,计算公式如下:其中h为各监测站之间距离,n是由h分开的成对样本的数量,z(xi)是第i个监测站的空气质量指数,z(xi+h)为与监测站xi距离为h得监测站的空气质量指数值;步骤4:将监测站分为两部分,收集了空气质量数据的监测站为标记样本,即已知点,其余未收集空气质量数据的监测站为未标记样本,即未知点,利用收集到的监测站数据以及根据监测站之间的距离与半方差之间的关系所拟合的模型对未标记样本进行插值估算,估算公式如下:其中z0为未标记样本的AQI估计值,为标记样本的AQI值,s是用来估算未知点的已知点的数目,为各在估计时影响大小的系数,由以下方程组计算:其中γ(xi,xj)为xi与xj之间的半变异函数值,μ为拉格朗日常数;步骤5:采用以下公式作为对所插数据的预估误差作为置信度评判的指标:MSE(Z0)=σ2{1‑rTR‑1r+(1‑FR‑1r)2/FTR‑1F}其中σ2为方差,R称为相关矩阵,由所有已知样本点之间的半变异函数值组成,r称为相关矢量,由未知点与所有已知样本点之间的半变异函数值组成,计算公式如下:F=[1 ... 1]T步骤6:直接选择对未收集数据的监测站预估值误差最大的点为置信度最低的未标记样本,从插值结果中选择满足置信度要求的未标记样本并主动收集该监测站数据,加入到标记样本集中,并从未标记样本集中去除该样本;步骤7:重新训练克里金插值模型,直至满足精度要求、成本要求或数量要求为止;此时已选取最少的位置对空气质量进行采样并最大程度准确地推测出了其他位置的空气质量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811468938.0/,转载请声明来源钻瓜专利网。