[发明专利]一种快速的基于混合特征KDE条件熵矩阵式的特征选择方法在审
申请号: | 201710526056.4 | 申请日: | 2017-06-30 |
公开(公告)号: | CN107391444A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 代建华;高帅超;徐思琪 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 刘玥 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供提出一种快速的基于混合特征KDE条件熵矩阵式的特征选择方法,该方法提出了核矩阵、数据向量、划分矩阵以及核划分矩阵的概念,并基于这些概念,提出了混合特征KDE熵的矩阵式,使得混合特征KDE条件熵的计算效率大大提高,从而提高了基于混合特征KDE条件熵矩阵式的特征选择方法的效率。 | ||
搜索关键词: | 一种 快速 基于 混合 特征 kde 条件 矩阵 选择 方法 | ||
【主权项】:
一种快速的基于混合特征KDE条件熵矩阵式的特征选择方法,其特征在于:包括如下步骤:步骤1,选取n个样本的完整的数据集U,该数据集U包含混合的条件特征集F和决策特征D,D的值域为[1,ND],选择特征数的最大值K,变化阈值T,窗宽参数h,离散压缩阈值L;步骤2,初始化选择出来的离散特征集SA和选择出来的连续特征集SX为空集,已选特征集S=SA∪SX,未被选择的特征集E=F,选择一个特征前后的条件熵之差步骤3,选取E中每一个特征Q加入S,其中Q的数据向量为已选离散特征集SA的数据向量为的最大值为NS,已选连续特征集SX的协方差矩阵为核矩阵为ΦS,计算增量后的连续特征集TX、协方差矩阵及核矩阵ΦT和增量后的离散特征集TA、特征集TA的数据向量及的最大值NT;步骤4,将离散特征集TA对应的数据向量转化为n×NT的划分矩阵M(TA)=(mi,a);步骤5,将离散属性集和决策属性的组合(TA,D)对应的联合数据向量转化为n×(NT×ND)的划分矩阵M(TA∩D),其中ai=(aTi‑1)×ND+di;步骤6,由连续特征集TX及核矩阵ΦT=(φk,i),离散特征集TA对应的划分矩阵M(TA)=(mi,a)及值域上界NT获得混合特征KDE条件熵的矩阵式;步骤7,选择混合特征KDE条件熵最小的属性并计算条件熵之差步骤8,判断Q*的特征属性,如果Q*为连续特征,则令SX=SX∪{Q*},并更新SX的协方差矩阵和核矩阵ΦS;步骤9,如果Q*为离散特征,则令SA=SA∪{Q*},判断SA中离散特征个数|SA|>L,如果满足条件,则对SA的数据向量进行压缩,更新离散特征数据向量和的最大值NS;令S=SA∪SX,E=E‑Q*;步骤10,判断条件熵之差是否满足阈值,即且已经选择出来的特征数|S|<K,如果满足条件,则返回步骤3;否则,输出已选特征集S。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710526056.4/,转载请声明来源钻瓜专利网。