[发明专利]一种用于分类的特征尺度下界的计算方法在审
申请号: | 201910027916.9 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109800803A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 朱杰英;卢盛林 | 申请(专利权)人: | 广东奥普特科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 潘俊达 |
地址: | 523000 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征尺度 下界 标准化因子 分类准确度 特征变化量 比例估算 分类问题 样本特征 异类样本 分类 度量 样本 通用 | ||
本发明涉及一种用于分类的特征尺度下界的计算方法。分类问题中,不同类的特征尺度是用来度量特征到各自类的距离的标准化因子;特征尺度是根据样本的特征变化量获取的,一般情况下相对小的值并不准确和稳定,需要用共同的特征尺度下界来进行限定。本发明中每个特征尺度下界从一个远小于目标的值的开始,依据不增加异类样本误分到本类的原则逐步提升,实现了按特征尺度的中值或样本特征的范围长度的一定比例估算特征尺度下界。本方法可以有着更好的分类准确度,而且不需要调节参数,参数值一般都通用。
技术领域
本发明属于模式识别和机器视觉技术领域,具体涉及一种用于分类的特征尺度下界的计算方法。
背景技术
在分类问题中,按目标到各个类的偏离度(也可看作距离)远近来确定目标的归属是直接又简单的分类方法,但是不同的特征的量级可能是不一样的,即使同一特征对不同的类来说量级也可能不一样,所以要对每个类的每个特征建立一个特征尺度,作为比较的依据。从每个类的样本特征变化可以估算出一个特征尺度,由于样本的不确定性和随机性,对于不同的类的同一种特征,相对小的值往往不稳定,所以用一个共同的特征尺度下界来进行约束,见参考文档[1];特征尺度下界可以从样本特征的范围长度或者特征尺度的中值乘以一个系数估算,但是这不一定能得到分类效果最合适的特征尺度下界值,而且需要手动调节系数进行尝试。
发明内容
本发明的目的在于:针对参考文档中的分类器的特征尺度下界的简单估计方式的缺点,通过训练样本的方式来得到更有利于正确分类的特征尺度下界值。为实现上述目的,本发明采用如下技术方案:
S1、输入所有样本的特征矢量和类别名,找到每一特征在所有样本上的最大值Mf和最小值mf,记下每一个特征的范围长度Rf=Mf-mf;如果Rf≤δf,设置权值wf=0,表示该特征无效,否则设置wf=1;计算特征尺度下界的上界UfRf,并初始化特征尺度下界Lf=αUfRf,其中0<α≤0.1;
S2、按参考文档[1],计算每个类的样本特征中心Cb,f和样本特征尺度其中N为该子类的样本总数,X为特征值,b为子类序号,s为样本序号,p为正整数;然后得到特征尺度另外一个样本到一个类的偏离度的计算公式:其中X为特征矢量,Xf为序号为f的特征值,也即X的第f个分量,F为特征总数;
S3、对每一个类别,收集一些非本类的邻近样本做成Class-Sample对(简称CS对)放到待检测的序列Pairs中,一个CS对中含有一个类别指针和一个样本指针;加入Pairs的CS对要满足两个条件:首先,CS对中的样本不属于CS对中的类别;其次,设CS对中的类别的序号为b,CS对中的样本所属类别的序号为i,该样本的特征矢量为X,令Do=D(X,b),Di=max{D(X,i),1},计算CS对的偏离度比值K=Do/Di,只保留K≥3的CS对;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奥普特科技股份有限公司,未经广东奥普特科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910027916.9/2.html,转载请声明来源钻瓜专利网。