[发明专利]基于FSA-Choquet模糊积分的特征选择方法在审
申请号: | 202010377781.1 | 申请日: | 2020-05-07 |
公开(公告)号: | CN111709440A | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 王怀军;商珣超;李军怀;崔颖安 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 罗笛 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 fsa choquet 模糊 积分 特征 选择 方法 | ||
1.基于FSA-Choquet模糊积分的特征选择方法,其特征在于,包括以下步骤:
步骤1,初始化带有特征的原始数据集X,使用Choquet模糊积分优选出最优特征子集;
步骤2,然后通过最大冗余计算,结合后向浮动搜索策略及分类器进行特征优选。
2.根据权利要求1所述的基于FSA-Choquet模糊积分的特征选择方法,其特征在于,所述步骤1具体为:
步骤1.1,设原始数据集X,具体为公式(1);
公式(1)中参数k代表特征种类数,n代表总体样本数,矩阵第i行第j列元素代表第i个样本第j种特征的值大小;
步骤1.2,基于步骤1.1中的原始数据集X,通过模糊密度如公式(2),生成模糊密度矩阵D,如公式(3),转置,生成矩阵D′,如公式(4),随后对矩阵D′中每行元素由小到大排序,生成矩阵M,得到公式(5);
公式(2)中,参数na为类别的数量,参数P(ai)为类别ai出现的概率,参数σ(fj,ai)为特征fj在类别ai中的标准差,参数σ(fj)为整个样本中的标准差;
公式(3)中,ι代表分类种类数,矩阵第i行第j列元素代表第j种特征在第i种分类类别下的模糊密度;
步骤1.3,结合步骤1.2中矩阵D′和λ-模糊测度,计算不同特征的λ值,如公式(5),同时计算矩阵M的模糊测度矩阵U,如公式(7);
[λ1,λ2,......,λk] (6)
公式(7)中,矩阵U中第i行代表第i种特征在不同类别幂集下的模糊测度;假设类别集和A={a1,a2,...,an},则μ1l代表类别全集的模糊测度,μ2l代表类别子集{a2,a3,...an}的模糊测度,μll代表类别子集{an}的模糊测度,也就是第i种特征在第ι种类别下的模糊密度;
步骤1.4,结合步骤1.2中矩阵M、步骤1.3中的矩阵U和Choquet积分,计算得到不同特征的积分值,如公式(8):
其中,参数Cu(fi)为第i种特征的模糊积分值;
步骤1.5,将步骤1.4中每种特征的模糊积分值与设定的阈值比较,选择模糊积分值不小于阈值的特征加入到优选特征子集中,生成最优特征子集A={f′1,f′3,f′5...,f′q-2,f′q}。
3.根据权利要求1所述的基于FSA-Choquet模糊积分的特征选择方法,其特征在于,所述步骤2具体为:
步骤2.1,将步骤1中的最优特征子集A初始化,通过最大冗余计算公式,如公式(9),得到优选特征集合S,
max(R(S))
其中,label表示要识别的类别种类数,ni表示第i类的样本总数,xk表示在第i个类别下特征x在第k个样本下的真实值,yk表示在第i个类别下特征x在第k个样本下的真实值。
步骤2.2,用步骤2.1中的优选特征集合S训练分类器,获得分类模型,并测试测试集;
步骤2.3,比较连续两次分类的准确率,若准确率提高,则修改S特征集合,通过使用每次优选的特征子集训练分类模型并做测试,获得自适应不同分类器和分类动作的最优特征子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010377781.1/1.html,转载请声明来源钻瓜专利网。