[发明专利]基于数据挖掘的城市大气污染联防联控区域划分方法在审
申请号: | 202010627532.3 | 申请日: | 2020-07-02 |
公开(公告)号: | CN111737321A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 杨光飞;张连奎 | 申请(专利权)人: | 大连理工大学人工智能大连研究院;大连凌空数据科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06Q50/26 |
代理公司: | 天津展誉专利代理有限公司 12221 | 代理人: | 任海波 |
地址: | 116000 辽宁省大连*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 挖掘 城市 大气污染 联防 区域 划分 方法 | ||
本发明涉及大气污染防治,尤其涉及一种基于数据挖掘的城市大气污染联防联控区域划分方法,利用数据挖掘中的频繁项集技术作为城市间的空气污染相似距离的度量方法,然后采用层次聚类的方法来识别划分联防联控区域。本方法只需要挖掘大气污染数据,发现城市之间的污染模式来确定城市的污染相似距离,基于数据挖掘的方法不需要额外的地理数据,对大气污染数据分布没有要求,对数据的缺失值和异常值不敏感。模型参数较少,不需要复杂的计算,容易实施。本方法具有模型参数少、可解释性强、准确率高、占用资源少、鲁棒性好等优势。
技术领域
本发明涉及大气污染防治,尤其涉及一种基于数据挖掘的城市大气污染联防联控区域划分方法。
背景技术
随着中国经济的快速发展,我国城市区域出现严重的大气污染。大气污染对国家的经济发展和人民的健康都产生了严重的影响。中国的大气污染具有较强的区域性,因此对于大气污染,不能仅对单一的城市治理,而要对具有污染关联的城市群采取区域联防联控能治理政策。国家大型赛事和会议期间采取的区域空气保障措施取得良好效果,也表明了区域联防联控政策比单一城市治理更具优势。科学合理的联防联控区域划分方法是城市大气污染联防联控政策的关键,而目前几乎找不到符合上述场景(城市大气污染联防区域划分)的应用方法。能找到的方法多用于城市大气污染的监测技术和城市间大气污染物的扩散路径模拟以及城市间大气污染传输规律的分析技术。
相关的学术文献1(Wang,H.,Zhao,L.,2018.A joint prevention and controlmechanism for air pollution in the Beijing-Tianjin-Hebei region in chinabased on long-term and massive data mining of pollutant concentration.ATMOSENVIRON 174,25-42.DOI:10.1016/j.atmosenv.2017.11.027)利用城市的污染物浓度数据之间的皮尔森系数(Pearson Correlation Coefficient)作为城市大气污染之间的关联距离度量方法,采用聚类方法来划分污染联合治理区域性。该方法的优点是能直接的运用污染物浓度数据,不需要复杂理论模型,从数据的角度分析城市污染的相似性,划分联防联控区域。
但该方法依赖于皮尔逊相关系数来衡量城市污染之间的相似性距离。皮尔逊相关系数是度量两个正态分布的变量之间线性相关程度,并且皮尔斯相关系数易受极值影响,这导致皮尔森相关系数不适合用于度量复杂的非线性的城市大气污染之间的相似性,会使联防联控区域划分结果不可靠。
学术文献2(Liu,J.,Li,W.,Wu,J.,2018.A framework for delineating theregional boundaries of PM2.5 pollution:A case study of China.ENVIRON POLLUT235,642-651.DOI:10.1016/j.envpol.2017.12.064)通过计算城市之间的PM2.5时间序列数据之间的互关联系数来度量城市的之间的关系。采用时间聚类方法来用于划定PM 2.5的边界并确定PM 2.5污染物相互作用的区域。
此研究的局限主要是对数据的分布要求较高,对数据的缺失和缺失异常值敏感,无法适应复杂的大气污染数据,方法容易造成区域划分不准确。
学术文献3(薛安,耿恩泽.基于复杂网络的中国城市PM_(2.5)区域划分[J].应用基础与工程科学学报,2015,23(S1):68-78.DOI:10.16058/j.issn.1005-0930.2015.s1.008)以城市作为节点,以城市间PM2.5质量浓度的相关性与距离的比值作为边的权重,构建了中国城市PM2.5污染加权网络,并采用Girvan Newman算法(GN算法)对网络进行划分,得到了PM2.5污染的区域分布情况。
此研究的局限主要是要求大气污染数据符合正态分布,并且建立的城市大气污染网络结构模型复杂。GN算法的时间复杂度高,计算效率慢。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学人工智能大连研究院;大连凌空数据科技有限公司,未经大连理工大学人工智能大连研究院;大连凌空数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010627532.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置