[发明专利]基于Kohonen网络聚类和ReliefF特征选择的空气质量指数预测方法有效
申请号: | 201910756927.0 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110569883B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 陈伯伦;朱国畅;朱全银;袁燕;于永涛;马甲林 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06F18/23 | 分类号: | G06F18/23;G06F18/211;G06V10/82;G06N3/0464;G06N3/088;G06Q10/04;G01W1/10 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王恒静 |
地址: | 223005 江苏省淮安市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 kohonen 网络 relieff 特征 选择 空气质量 指数 预测 方法 | ||
1.一种基于Kohonen网络聚类和ReliefF特征选择的空气质量指数预测方法,其特征在于,包括:
(1)对原始空气数据集Air进行预处理,得到处理后的空气数据集A;
(2)采用Kohonen网络聚类,将数据集A分为m类,得到第k类数据集Ak,k∈[1,m];
(3)采用ReliefF特征选择算法处理数据集Ak,得到第k类数据集Ak特征重要程度的排名Rk;
所述步骤3的具体包括:
(31)定义第k类数据集Ak的第f个特征,f∈[1,7×t],f的初始值为1;
(32)定义数据集Ak为ReliefF算法的类别Fk1,其余类别为ReliefF算法的类别Fk2,k的初始值为1;
(33)定义Pk为类别Fk1在数据集A中所占的比例;
(34)定义diff(f,x,y)表示样本x与样本y在特征f上的差,如果x(f)=y(f),则diff(f,x,y)=0,否则diff(f,x,y)=1;
(35)从类别Fk1中随机选取一个样本x,选取与该样本距离最近的q个最近邻Hk,Hk={h1,h2,…,hr,…,hq},从类别Fk2中选取与该样本距离最近的q个最近邻Mk,Mk={m1,m2,…,mr,…,mq};
(36)令特征权重W(f)=0;表示为:
(37)f=f+1;
(38)如果f7×t,跳转到步骤(39),否则跳转到步骤(35);
(39)对特征权重W(f)进行排序,得到第k类数据集Ak的特征排名Rk;
(310)k=k+1;
(311)如果km,跳转到步骤(312),否则,跳转到步骤(34);
(312)得到所有类别的特征排名R,R={R1,R2,…,Rk,…,Rm};
(4)通过特征重要程度排名Rk,删去第k类数据集Ak排名后c个特征,得到第k类经过特征选择后的数据集Fk;
(5)通过NAR神经网络,用数据集Fk前t天的数据预测t+1天的空气质量指数,得到第k类NAR神经网络训练模型netk;
(6)根据数据集A中随即数据x所在类的特征排名Rz选取特征,用模型netz得到预测结果y;
所述步骤6具体包括:
(61)定义z为x所在的第z类,z∈[1,m];
(62)令k=1,dmin为dxk的最小值;
(63)计算Ak类的中心ak,即Ak中所有数据的平均值;
(64)计算x与ak的距离dxk,dxk=||x-dxk||;
(65)如果dmindxk,跳转到步骤(66),否则跳转到步骤(68);
(66)dmin=dxk;z=k;
(67)k=k+1;
(68)如果km,跳转到步骤(69),否则跳转到步骤(63);
(69)令f=7×t;
(610)查询特征f在Rz中的特征排名;
(611)如果f在特征排名Rz后c个,c∈[1,7×t-1],则跳转到步骤(612),否则跳转到步骤(614);
(612)如果f不是空气质量指数,则跳转到步骤(613),否则跳转到步骤(614);
(613)删除f所在特征;
(614)f=f-1;
(615)如果f=0,则跳转到步骤(616),否则跳转到步骤(610);
(616)遍历结束,得到经过特征选择后的x’;
(617)将x’作为所在类的NAR神经网络训练模型netz的输入,得到预测结果y。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910756927.0/1.html,转载请声明来源钻瓜专利网。