[发明专利]基于邻域粗糙集和PCA融合的数据分类预测方法有效
申请号: | 201710237405.0 | 申请日: | 2017-04-12 |
公开(公告)号: | CN107016416B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 王国胤;董建华;尚明生;严胡勇;王浩林;郑志浩;史晓雨 | 申请(专利权)人: | 中国科学院重庆绿色智能技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 尹丽云 |
地址: | 400714 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 邻域 粗糙 pca 融合 数据 分类 预测 方法 | ||
1.一种基于邻域粗糙集和PCA融合的数据分类预测方法,其特征在于,包括:
采集水质检测样本数据,形成样本数据集S;
根据样本数据集,计算邻域粗糙集权重向量和主成分权重向量;
通过对所述邻域粗糙集权重向量和主成分权重向量进行融合,获取融合后的权重向量,形成新样本数据集S’,并对样本数据集S中的数据进行分类和预测;
根据所述融合后的权重向量,构造新样本数据集S’,在所述新样本数据集S’中选择一个子集作为支持向量机的训练样本集,选择其它子集作为测试样本集,根据支持向量机的训练样本集建立支持向量机模型,根据支持向量机模型进行数据等级分类和水质预测;
通过如下公式对所述邻域粗糙集权重向量和主成分权重向量进行融合,获取融合后的权重向量:
其中,m(Ai)为合成权重,R(Ai)为邻域粗糙集权重向量中第i个邻域粗糙集权重,P(Ai)为主成分权重向量中第i个主成分权重,融合后的权重向量D=m(A1),m(A2),…,m(Am),i=1,2……m。
2.根据权利要求1所述的基于邻域粗糙集和PCA融合的数据分类预测方法,其特征在于:所述新样本数据集S’通过如下步骤获取:
通过条件属性集A={A1,A2,…,Am}对样本数据集S进行描述,确定条件属性集A={A1,A2,…,Am}的决策属性;
依次将条件属性集A={A1,A2,…,Am}中的第i列所有样本Ai与增益量m(Ai)相乘,获取新样本数据集S’的条件属性集A’={A1’,A2’,…,Am’};
约简新样本数据集S’中增益为0的属性列。
3.根据权利要求2所述的基于邻域粗糙集和PCA融合的数据分类预测方法,其特征在于:通过如下公式对样本数据集S中每条样本数据进行评价:
其中,Fi为样本数据S中的第i条数据的综合评价指数,m'为样本集约简后的列数,S'ij为新样本数据集S’约简后的第i条,第j列的样本数据;
根据Fi值对样本数据集S中样本数据进行优劣比较,Fi值越大,则质量越差。
4.根据权利要求1所述的基于邻域粗糙集和PCA融合的数据分类预测方法,其特征在于:通过归一化因子判断邻域粗糙集权重向量和主成分权重向量之间的冲突程度,若K≠1,则融合后的权重构成权重分配向量,如果K=1,则不存在融合后的权重向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院重庆绿色智能技术研究院,未经中国科学院重庆绿色智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710237405.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防止翻车的快递车
- 下一篇:平视显示器