[发明专利]一种离散数据集冗余特征约减的数据融合方法在审
申请号: | 201811072282.0 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109447106A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 周建中;刘英;赵宇杰;杜义;刘涵;李玲;姜伟;单亚辉;李超顺;田弟巍;王齐飞 | 申请(专利权)人: | 国家电网有限公司;国网新源控股有限公司;湖北白莲河抽水蓄能有限公司;华中科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 100000 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离散数据 数据融合 数据集 融合 分类结果 冗余特征 属性集 粗糙集理论 数据集属性 单独属性 计算分析 决策属性 时间开销 条件属性 双向的 减小 分工 应用 分析 | ||
1.一种离散数据集冗余特征约减的数据融合方法,其特征在于,包括:
(1)对待融合的离散数据集按照属性集中的每个属性进行分类,得到分类结果S;
(2)所述属性集包括条件属性集和决策属性集,根据分类结果S,计算按照条件属性集进行分类的第一分类结果U/C和按照决策属性集进行分类的第二分类结果U/D;
(3)当第一分类结果U/C对第二分类结果U/D的上下近似相同时,计算第一分类结果U/C依次去除条件属性集中的一个条件属性后的第三分类结果,当第三分类结果不能实现对第二分类结果U/D的完整描述时,将第三分类结果对应的去除的条件属性作为核属性集core,根据核属性集core得到核属性分类结果core_set,当第三分类结果能实现对第二分类结果U/D的完整描述时,将第三分类结果对应的去除的条件属性作为非核属性集;
(4)计算核属性分类结果core_set对第二分类结果U/D的上下近似是否相同,若相同则待融合的离散数据集的最小属性集RED=core,否则进入步骤(5);
(5)若非核属性集中非核条件属性的个数小于2,则待融合的离散数据集的最小属性集RED为条件属性集,否则同时对非核属性集进行正向约减与逆向约减,得到最终的待融合的离散数据集的最小属性集RED。
2.如权利要求1所述的一种离散数据集冗余特征约减的数据融合方法,其特征在于,所述步骤(3)还包括:
当第一分类结果U/C对第二分类结果U/D的上下近似不相同时,待融合的离散数据集的最小属性集RED为空集。
3.如权利要求1或2所述的一种离散数据集冗余特征约减的数据融合方法,其特征在于,所述步骤(5)中同时对非核属性集进行正向约减与逆向约减的具体实现方式包括:
(5-1)设置正、逆向约减停止标志以及相邻位置标志f_stop、r_stop和near_flag为0;
(5-2)正向约减从非核属性集中按顺序选择第一个非核条件属性作为第一组合开始,依次增加第一组合中非核条件属性个数,并且记录第一组合中非核条件属性个数为i_f,将第一组合与核属性集core结合后计算分类结果,而逆向约减从非核属性集中选择所有的非核条件属性作为第二组合开始,依次减少第二组合中非核条件属性个数,并且记录剩余的非核条件属性个数为i_r,将第二组合与核属性集core结合后计算分类结果;
(5-3)若i_f和i_r不相邻,相邻位置标志near_flag保持为0不变;
(5-4)若i_f和i_r相邻,则相邻位置标志near_flag为1。
4.如权利要求3所述的一种离散数据集冗余特征约减的数据融合方法,其特征在于,所述步骤(5-3)包括:
(5-3-1)若i_f和i_r不相邻,相邻位置标志near_flag保持为0不变,对于逆向约减过程,在逆向约减停止标志r_stop不为1的情况下,若在逆向约减过程中出现能区分U/D的第二组合,则记录当前非核条件属性个数i_r和第二组合编号位置no_r,之后在第二组合中按顺序减少一个非核条件属性,进入i_r-1个非核条件属性的第二组合的循环中;
(5-3-2)若逆向约减过程中发现遍历第二组合后不能区分U/D且r_stop仍然为0,则暂停当前逆向约减过程,设置正向约减停止标志f_stop为1以停止正向约减过程;
(5-3-3)对于正向约减过程,在正向约减停止标志f_stop标志不为1的前提下,若在正向约减过程中出现能区分U/D的第一组合,则暂停当前正向约减过程,记录当前非核条件属性个数i_f的值以及相应的第一组合编号no_f,同时设置r_stop标志为1以停止逆向约减过程。
5.如权利要求3所述的一种离散数据集冗余特征约减的数据融合方法,其特征在于,所述步骤(5-4)包括:
(5-4-1)若i_f和i_r相邻,则相邻位置标志near_flag为1,对于逆向约减过程,在逆向约减过程停止标志r_stop仍为0且正向约减等待标志wait不为1的情况下,若有可区分U/D的第二组合,记录当前的第二组合编号no_r并添加该第二组合至R_RED中,继续进行当前的逆向约减过程直至步骤(5-2)得到的所有第二组合全部遍历完成或者逆向约减过程停止标志r_stop标志变为1;
(5-4-2)若步骤(5-4-1)遍历完成后R_RED非空,则逆向约减过程中判断正向约减等待标志wait标志是否为1,当wait标志为1,将正向约减过程停止标志f_stop设置为1并且RED即为R_RED,否则当正向约减过程中出现可区分U/D的第一组合将r_stop设置为1从而停止当前的逆向约减过程;
(5-4-3)逆向约减过程中,若逆向约减过程停止标志r_stop不为1且遍历完步骤(5-2)得到的所有第二组合后无法区分U/D,停止当前的正逆向约减过程,将正向约减过程停止标志f_stop设置为1;
(5-4-4)逆向约减过程中,若逆向约减过程停止标志r_stop不为1且正向约减等待标志wait为1,则当逆向约减过程中找到最小约减,就记录当前的第二组合的i_r和第二组合编号no_r,并停止当前正逆向约减过程,f_stop标志置1;
(5-4-5)正向约减过程中,在正向约减过程停止标志f_stop不为1的情况下,若搜索到一个能区分U/D的第一组合,则记录当前的第一组合位置编号,并停止当前的逆向约减过程,并将r_stop设置为1;
(5-4-6)正向约减过程中,在正向约减过程停止标志f_stop不为1的情况下,若遍历完第一组合无法区分U/D,则应停止当前正向约减过程,置等待标志wait为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;国网新源控股有限公司;湖北白莲河抽水蓄能有限公司;华中科技大学,未经国家电网有限公司;国网新源控股有限公司;湖北白莲河抽水蓄能有限公司;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811072282.0/1.html,转载请声明来源钻瓜专利网。