[发明专利]一种用于分类的特征尺度下界的计算方法在审
申请号: | 201910027916.9 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109800803A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 朱杰英;卢盛林 | 申请(专利权)人: | 广东奥普特科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 潘俊达 |
地址: | 523000 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用于分类的特征尺度下界的计算方法。分类问题中,不同类的特征尺度是用来度量特征到各自类的距离的标准化因子;特征尺度是根据样本的特征变化量获取的,一般情况下相对小的值并不准确和稳定,需要用共同的特征尺度下界来进行限定。本发明中每个特征尺度下界从一个远小于目标的值的开始,依据不增加异类样本误分到本类的原则逐步提升,实现了按特征尺度的中值或样本特征的范围长度的一定比例估算特征尺度下界。本方法可以有着更好的分类准确度,而且不需要调节参数,参数值一般都通用。 | ||
搜索关键词: | 特征尺度 下界 标准化因子 分类准确度 特征变化量 比例估算 分类问题 样本特征 异类样本 分类 度量 样本 通用 | ||
【主权项】:
1.一种用于分类的特征尺度下界的计算方法,其特征在于:S1、输入所有样本的特征矢量和类别名,找到每一特征在所有样本上的最大值Mf和最小值mf,记下每一个特征的范围长度Rf=Mf‑mf;如果Rf≤δf,设置权值wf=0,表示该特征无效,否则设置wf=1;计算特征尺度下界的上界UfRf,并初始化特征尺度下界Lf=αUfRf,其中0<α≤0.1;S2、按参考文档[1],计算每个类的样本特征中心Cb,f和样本特征尺度![]()
其中N为该子类的样本总数,X为特征值,b为子类序号,s为样本序号,p为正整数;然后得到特征尺度
另外一个样本到一个类的偏离度的计算公式:
其中X为特征矢量,Xf为序号为f的特征值,也即X的第f个分量,F为特征总数;S3、对每一个类别,收集一些非本类的邻近样本做成Class‑Sample对(简称CS对)放到待检测的序列Pairs中,一个CS对中含有一个类别指针和一个样本指针;加入Pairs的CS对要满足两个条件:首先,CS对中的样本不属于CS对中的类别;其次,设CS对中的类别的序号为b,CS对中的样本所属类别的序号为i,该样本的特征矢量为X,令Do=D(X,b),Di=max{D(X,i),1},计算CS对的偏离度比值K=Do/Di,只保留K≥3的CS对;S4、根据搜集的CS对序列Pairs,依次循环扫描每个有效的Lf并逐步增加Lf的值,但每次更新Lf的值要满足两个条件:一是不能大于其上界UfRf;二是更新前后,Pairs中的任何一个CS对的偏离度比值的改变都要满足:记更新前的偏离度比值为K1,更新后的比值为K2,如果K2<4则需满足K2≥γ(K1)K1,其中γ(K1)=1‑(0.1K1)4或形状相近的函数也可;不满足这两个条件就停止更新Lf,直到所有wf≠0的Lf都更新完毕;最后对标记为同一种的所有特征的Lf值求平均后再赋给它们,这里的求平均也可用取中值代替。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奥普特科技股份有限公司,未经广东奥普特科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910027916.9/,转载请声明来源钻瓜专利网。