[发明专利]一种基于动态滑窗的污染废气关联分析方法有效
申请号: | 202011534506.2 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112634113B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 王晓凯;朱涛;卫晓旭;凌德森 | 申请(专利权)人: | 山西大学 |
主分类号: | G06Q50/26 | 分类号: | G06Q50/26;G06Q10/0639;G06F17/18 |
代理公司: | 太原申立德知识产权代理事务所(特殊普通合伙) 14115 | 代理人: | 程园园 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 污染 废气 关联 分析 方法 | ||
1.一种基于动态滑窗的污染废气关联分析方法,其特征在于:包括以下步骤:
步骤1,含变异系数的动态滑窗;
步骤2,Spearman相关系数和MIC的加权;
步骤3,动态关联分析算法;所述步骤1含变异系数的动态滑窗还包括以下步骤:
步骤S1.1:根据设置的初始窗长L0截取数据段,并求取截取的数据段的变异系数C:
其中σ0是该段数据的标准差,m0是该段数据的平均值;
步骤S1.2:将该数据段再分成s段,每段长度为L0/s;
步骤S1.3:求取每小段的变异系数Ci:
其中σi是第i小段数据的标准差,mi是第i小段数据的平均值;
步骤S1.4:求取该数据段的变异系数变化率R:
步骤S1.5:滑窗长度调整比例k为:
且:
其中kmax,kmin为稳定性判别阈值,L为更新后的窗口长度;所述步骤2Spearman相关系数和MIC的加权还包括以下步骤:
步骤S2.1,首先把时序数据x按升序或者降序排列得到排序数列a={a1,a2,…,an},将数据x内每个元素在数列a中的位置记为ri,称其为该元素的秩次,从而得到数据x对应的秩次数列r;
将另一时序数据y按升序或者降序排列得到排序数列b={b1,b2,…,bn},继而可以得到时序数据y对应的秩次数列e;
将数列r和数列e内每个元素对应相减得到秩次差数列d={d1,d2,…,dn},再将其带入斯皮尔曼相关系数公式:
式中:n为数据样本量,ρ为斯皮尔曼相关系数,i为第i个样本;
步骤S2.2,对于给定的数据集D={(Xi,Yi),i=1,2,…,n},如果将X轴划分为f个格子,Y轴划分为g个格子,那么我们可以得到一个f×g的网络划分G,将落入G的点的数量占数据集D数量的比例看作是其概率密度D|G,而根据不同的网格划分情况得到的概率分布D|G,变量X和Y的最大互信息I为:
其中,D是给定的数据集;f,g是对这个数据集的某种划分数量;p(X,Y)是联合概率密度,p(X)和p(Y)是边缘概率密度,
相同f×g的网络划分有很多种情况,会得到不同的互信息值,记录其中最大的互信息值为MI(D,X,Y),之后在进行归一化,使其取值在[0,1]之间:
取不同网格划分下的最大的归一化后的互信息值作为最大信息系数的值;假设样本数量为n,最大信息系数MIC(D)的定义为:
其中fgB(n)为网格划分的上界,B(n)=n0.6效果最佳;所述步骤3动态关联分析算法还包括以下步骤:
步骤S3.1,获取异常污染物浓度数据和其他污染物浓度数据;
步骤S3.2,截取T时刻及T时刻前一定长度L0异常污染物历史数据,L0为初期调研实验后得出的最佳值;
步骤S3.3,通过步骤S1的变异系数和变异系数变化率判断数据是否稳定,kmax,kmin为初期调研实验后得出的最佳值;
步骤S3.4,当数据稳定时,再进行Spearman相关系数和最大信息系数加权相关方法进行关联分析;若数据不稳定,则通过调整规则调整滑窗长度,然后再进行关联分析;
步骤S3.5,判断所有数据是否全部完成动态关联分析,没有全部完成,则截取T+1时刻重复步骤S3.2到步骤S3.4;
步骤S3.6,当数据已全部完成动态关联分析,输出动态关联结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011534506.2/1.html,转载请声明来源钻瓜专利网。