[发明专利]一种基于特征尺度和子类分裂的分类器在审
申请号: | 201910027912.0 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109784398A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 朱杰英;卢盛林 | 申请(专利权)人: | 广东奥普特科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 潘俊达 |
地址: | 523000 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子类 特征尺度 分类器 偏离度 特征矢量 度量 分裂 样本 机器视觉技术 分类过程 模式识别 样本中心 异类样本 受限制 正确率 归类 下界 偏离 检测 | ||
1.一种基于特征尺度和子类分裂的分类器,其特征在于:
训练和识别的步骤如下:
S1、输入所有训练样本的特征矢量和类别名;计算每个特征在所有样本上的范围长度Rf=maxsXs,f-minsXs,f,其中Xs,f表示第s个样本的第f个特征值;然后对于Rf等于或接近0的,也即Rf≤δf,设置该特征权值wf=0,当作无效特征,否则设置wf=1,其中δf是一个远比特征值域长度小的正数;
S2、将每个类看作一个子类,对每个子类计算样本特征中心Cb,f和样本特征尺度首先计算出样本特征中心再计算样本特征尺度其中N为该子类的样本总数,X为特征值,b为子类序号,s为样本序号,p为正整数;
S3、计算每个有效特征的特征尺度下界Lf,可选择以下两种方式之一进行计算,但如果平均每一类的不同特征的样本数<2,只能使用步骤S31的方式计算:
S31、Lf=βfRf,其中0<βf≤0.1,βf的值需手动调试或者使用经验值;
S32、Lf=μfMf,其中0.001≤μf≤100,Mf为所有子类上的样本特征尺度去掉的那些值后进行排序,中值即为Mf;如果每个类的样本充足或者类内样本形态多样,μf的取值就小些,反之μf的取值就大些;
然后对属于同一种的多个有效特征的Lf要平均后再赋给它们;无效特征的Lf可以赋值任意一个正数即可;
S4、计算特征尺度Sb,f:如果样本特征尺度则令特征尺度Sb,f=Lf,否则令如果每个类的样本都是单一的,也即任何两个类内样本比类间样本更相似,可以跳过步骤S5;
S5、子类分裂:
先给出计算公式:偏离度为其中X为目标的特征矢量,f为特征序号,Xf为序号为f的特征值,也即X的第f个分量,F为特征总数;偏离度比值为其中o为本子类的序号,i为异类样本所属子类的序号,X为异类样本的特征矢量,而另外要建立一个随偏离度比值增大而减小的分裂度函数E(K),要满足K值在3的附近快速下降,其它区间慢降,K≥6时基本降到接近0;
对每个子类,如果样本数多于一个,收集偏离度比值小的异类样本,统计这些异类样本对该子类的分裂度,如果达到或超过给定的阈值(这个阈值可通过测试来获得,基本是通用的),对该子类分裂为两个及以上的新子类,分裂的原则是使每个子类内的样本更相近;再按步骤S2中的方式对新子类计算各自的样本特征中心Cb,f、样本特征尺度和特征尺度Sb,f;分裂后的子类也要执行本步检测和决定是否需要继续分裂;
S6、输入待识别目标的特征矢量,要求特征类型与训练样本的一致,计算该特征矢量到各个子类的偏离度,得到偏离度最小的那个子类的所属类就是识别到的类。
2.权利要求1所述的分类器,其特征在于步骤S5中:分裂子类时可采用以下简单的方式:设本子类的序号为o,先找出这个比值最大的f,然后在本子类的第f个特征的样本均值处分开;Xo,s,f>Co,f的样本作为一个子类的样本,剩余的作为另一个子类的样本。
3.根据权利要求1所述的分类器,其特征在于:
对于周期性特征,可以使用更准确的计算方式:在步骤S1中输入周期特征的周期值;在步骤S2中,计算一个类的特征中心Cb,f和样本特征尺度时,需要计算两组:设周期值为T,一组是将所有的样本中的该特征值全部设置到[0,T)区间,计算特征中心和样本特征尺度,另一组是全部设置在[-T/2,T/2)区间进行计算;最后选择样本特征尺度小的那组,并将特征中心设置到[0,T)区间;在计算偏离度时,先将该特征值Xf设置到[0,T)区间,计算距离Dis=|Xf-Cb,f|,如果Dis>T/2,则令Dis=T-Dis,然后将Dis的值取代偏离度计算公式中的|Xf-Cb,f|这一部分即可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奥普特科技股份有限公司,未经广东奥普特科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910027912.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种青稞网斑病的识别方法
- 下一篇:基于改进字典学习的多源图像目标关联方法