[发明专利]一种主次特征优先级分类方法在审
申请号: | 201810507834.X | 申请日: | 2018-05-24 |
公开(公告)号: | CN108875790A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 孟庆浩;侯惠让 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 优先级分类 有效特征 次特征 优先级结构 特征分类 样本分类 优先级别 主特征 | ||
本发明涉及一种主次特征优先级分类方法,优先级高的特征具有优先分类决定权,即如果通过优先级别高的特征已经完成分类,后续优先级低的特征将会无效,此分类方法包括下列步骤:(1)建立特征优先级结构:将特征分为主特征和次特征两类,以主特征优先级最高,并设定各次特征优先级;(2)选择有效特征;(3)分类:根据建立的特征优先级,对每个样本分类时,选择优先级较高的有效特征进行单特征分类。
技术领域
本发明涉及一种模式识别方法。
背景技术
近些年,模式分类方法得到了快速发展。传统分类方法包括Fisher、贝叶斯、k近邻、决策树、支持向量机、神经网络和深度学习等。
传统分类方法主要包括数据预处理、特征提取、特征选择/降维及分类器设计几个环节,其中特征选取比较关键。为提高分类准确率,常常需要选取多维特征。不同特征具有不同的单特征分类准确率,其中决策树是唯一一个考虑了不同特征具有不同分类准确率的算法。在多维特征中,可能包含对提高分类准确率无帮助的冗余特征,而且这些冗余特征还会降低分类器的执行效率,因此有必要考虑不同特征的分类作用。
Russell等给出了决策树的一个定义{S.J.Russell,P.Norvig,andE.Pagesbouic,“Artificial intelligence:A modern approach,”Prentice Hall,1995.}:输入一种含有描述属性的对象或者情况,然后输出是/否的决定。决策树方法对所有特征进行了逐个评价,分析了每个特征的属性。但是决策树方法并没有选取出单特征分类准确率最高的特征,即不能充分发挥主特征的优势。如果没有充分利用高分类准确率的主特征,可能会导致分类准确率偏低。
发明内容
本发明的目的是提供一种准确率较高的模式分类方法,本发明将特征分为主、次两类特征,并建立特征优先级,通过优先级顺序,充分发挥主特征的优势,进一步提高分类准确率。技术方案如下:
一种主次特征优先级分类方法,优先级高的特征具有优先分类决定权,即如果通过优先级别高的特征已经完成分类,后续优先级低的特征将会无效,此分类方法包括下列步骤:
(1)建立特征优先级结构
将特征分为主特征和次特征两类,以主特征优先级最高,并设定各次特征优先级,方法如下:
首先将提取到的特征进行单特征分类,即只使用一个特征进行分类,根据分类准确率,选取准确率最优时的特征作为主特征,其余的作为次特征,定义不同类别的样本特征值不交叉的部分为特征有效部分,以特征有效部分的概率作为特征优先级评价指标,采用高斯概率确定次特征优先级;根据高斯分布,求取概率密度曲线与横坐标之间的面积即得到相关概率,概率越大,优先级越高,求取两类样本不交叉概率,以同样的方法求取其他次特征有效概率,最终根据概率值确定各个次特征的优先级;
(2)选择有效特征
针对某样本分类时,实际只有一个特征被选择用于分类,称之为有效特征,针对每个特征设定特征有效条件,符合设定条件时,认为特征有效,否则无效;根据特征有效条件,针对每个样本选取最优的特征用于分类,针对每个样本,首先考虑选择主特征,当主特征无效时,根据次特征的优先级顺序进行特征选择,一旦发现有效特征,则特征选择结束,如果所有特征均无效,则强制选择主特征为有效特征;
(3)分类
根据建立的特征优先级,对每个样本分类时,选择优先级较高的有效特征进行单特征分类。
其中,特征有效条件的设定如下:
1)次特征有效条件
对于两类分类,采取当两类样本的某个次特征互不交叉时,认为特征有效,否则无效;
2)主特征有效条件
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810507834.X/2.html,转载请声明来源钻瓜专利网。