[发明专利]基于耦合机器学习和相关性分析的大气污染物溯源方法有效
申请号: | 202110926497.X | 申请日: | 2021-08-12 |
公开(公告)号: | CN113610243B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 庞继伟;张栩;郭炜;李丽芬;高敏 | 申请(专利权)人: | 中节能天融科技有限公司 |
主分类号: | G06N20/20 | 分类号: | G06N20/20;G06Q50/26 |
代理公司: | 北京盛询知识产权代理有限公司 11901 | 代理人: | 方亚兵 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 耦合 机器 学习 相关性 分析 大气 污染物 溯源 方法 | ||
1.一种基于耦合机器学习和相关性分析的大气污染物溯源方法,其特征在于,具体包括以下步骤:
S1、获取目标区域内每个网格源站点的实时时空数据和历史时空数据;
S2、根据所述实时时空数据和所述历史时空数据,构建数据库;并从所述数据库中提取一段时间内的历史时空数据;
S3、根据所述一段时间内的历史时空数据,构建污染物浓度分布瞬态模型;
S4、利用高斯回归对所述污染物浓度分布瞬态模型进行特征提取,并对提取的特征进行标准化处理;
S5、利用机器学习算法构建可能污染源选取模型,并将提取的所述一段时间内的历史时空数据作为训练集对所述可能污染源选取模型进行训练;然后将所述提取的特征输入到训练完成的可能污染源选取模型中,输出网格源是否在传输路径上的结果;
S6、将所述实时时空数据重复步骤S3~S4,获取特征R2,μ,δ,并对所述特征进行标准化处理,得到预处理后的新增数据;
S7、将所述预处理后的新增数据作为输入到训练完成的可能污染源选取模型中,输出网格源是否在传输路径上;并将输出的结果增加到所述训练集中对所述可能污染源选取模型进行优化和不间断学习。
2.根据权利要求1所述的基于耦合机器学习和相关性分析的大气污染物溯源方法,其特征在于,所述实时时空数据和所述历史时空数据均包括:地理位置信息、各污染物浓度信息、采样时间和气象信息。
3.根据权利要求2所述的基于耦合机器学习和相关性分析的大气污染物溯源方法,其特征在于,所述S3具体为:
从所述历史时空数据中提取各污染物浓度信息,然后以传输通道网格源k构建的层级树结构为基础,并根据设定的污染事件得到有效时间窗口i和传输响应延时j,实时构建逐级待比较矩阵和相关系数矩阵,即污染物浓度分布瞬态模型。
4.根据权利要求3所述的基于耦合机器学习和相关性分析的大气污染物溯源方法,其特征在于,所述S4具体为:
将所述相关系数矩阵转换成相关系数向量,然后利用高斯回归对所述相关系数向量进行特征提取,得到高斯回归特征值R2k、μk,δk。
5.根据权利要求1所述的基于耦合机器学习和相关性分析的大气污染物溯源方法,其特征在于,所述可能污染源选取模型的表达式为:
其中,yk∈[0,1],0代表网格源k不在传输路径上,1代表网格源k在传输路径上;fk表示可能污染源选取模型,根据fk对每一个站点进行分析,记录yk=1的网格源k。
6.根据权利要求5所述的基于耦合机器学习和相关性分析的大气污染物溯源方法,其特征在于,所述机器学习算法包括随机森林、决策树、聚类、贝叶斯分类、支持向量机、EM和Adaboost。
7.根据权利要求5所述的基于耦合机器学习和相关性分析的大气污染物溯源方法,其特征在于,所述S7具体为:
对污染事件发生时刻和污染事件浓度向量重新赋值,重复步骤S1~S5,并进行逐级标记,直至相关系数最低,输出标记结果,即为传输通道与可能的污染源区域,结束迭代计算,实现模型不间断学习和优化。
8.根据权利要求3所述的基于耦合机器学习和相关性分析的大气污染物溯源方法,其特征在于,构建所述污染物浓度分布瞬态模型的方法具体为:
步骤1、根据国家标准设定污染事件触发条件,自动标记污染事件发生时刻t;
步骤2、基于所述步骤1,并通过设定的污染事件有效时间窗口i和传输响应延时j构建污染事件浓度向量Xi和逐级待比较向量
步骤3、根据所述逐级待比较向量构建逐级待比较矩阵
步骤4、基于所述逐级待比较矩阵构建网格源k的相关系数矩阵即污染物浓度分布瞬态模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中节能天融科技有限公司,未经中节能天融科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110926497.X/1.html,转载请声明来源钻瓜专利网。