[发明专利]一种基于特征尺度和子类分裂的分类器在审
申请号: | 201910027912.0 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109784398A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 朱杰英;卢盛林 | 申请(专利权)人: | 广东奥普特科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 潘俊达 |
地址: | 523000 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于模式识别和机器视觉技术领域,具体涉及一种基于特征尺度和子类分裂的分类器的实现方法。该分类器在训练时,先将每个类看作一个子类,每个子类的每个特征都有各自的特征尺度,特征尺度是用来度量一个特征矢量到一个子类的样本中心的偏离度的,是有下界限定的。如果类内的样本形态并不单一,还要检测每个子类的相近的异类样本的偏离度比值来决定是否对其分裂成更多的子类。分类过程就是目标的特征矢量离哪个子类的偏离度值最小,就归类到该子类所属的类。本分类器的优势在于识别正确率高,特征范围量级、样本形态和分布均不受限制、且可度量到一个类的偏离程度。 | ||
搜索关键词: | 子类 特征尺度 分类器 偏离度 特征矢量 度量 分裂 样本 机器视觉技术 分类过程 模式识别 样本中心 异类样本 受限制 正确率 归类 下界 偏离 检测 | ||
【主权项】:
1.一种基于特征尺度和子类分裂的分类器,其特征在于:训练和识别的步骤如下:S1、输入所有训练样本的特征矢量和类别名;计算每个特征在所有样本上的范围长度Rf=maxsXs,f‑minsXs,f,其中Xs,f表示第s个样本的第f个特征值;然后对于Rf等于或接近0的,也即Rf≤δf,设置该特征权值wf=0,当作无效特征,否则设置wf=1,其中δf是一个远比特征值域长度小的正数;S2、将每个类看作一个子类,对每个子类计算样本特征中心Cb,f和样本特征尺度
首先计算出样本特征中心
再计算样本特征尺度
其中N为该子类的样本总数,X为特征值,b为子类序号,s为样本序号,p为正整数;S3、计算每个有效特征的特征尺度下界Lf,可选择以下两种方式之一进行计算,但如果平均每一类的不同特征的样本数<2,只能使用步骤S31的方式计算:S31、Lf=βfRf,其中0<βf≤0.1,βf的值需手动调试或者使用经验值;S32、Lf=μfMf,其中0.001≤μf≤100,Mf为所有子类上的样本特征尺度
去掉
的那些值后进行排序,中值即为Mf;如果每个类的样本充足或者类内样本形态多样,μf的取值就小些,反之μf的取值就大些;然后对属于同一种的多个有效特征的Lf要平均后再赋给它们;无效特征的Lf可以赋值任意一个正数即可;S4、计算特征尺度Sb,f:如果样本特征尺度
则令特征尺度Sb,f=Lf,否则令
如果每个类的样本都是单一的,也即任何两个类内样本比类间样本更相似,可以跳过步骤S5;S5、子类分裂:先给出计算公式:偏离度为
其中X为目标的特征矢量,f为特征序号,Xf为序号为f的特征值,也即X的第f个分量,F为特征总数;偏离度比值为
其中o为本子类的序号,i为异类样本所属子类的序号,X为异类样本的特征矢量,而
另外要建立一个随偏离度比值增大而减小的分裂度函数E(K),要满足K值在3的附近快速下降,其它区间慢降,K≥6时基本降到接近0;对每个子类,如果样本数多于一个,收集偏离度比值小的异类样本,统计这些异类样本对该子类的分裂度,如果达到或超过给定的阈值(这个阈值可通过测试来获得,基本是通用的),对该子类分裂为两个及以上的新子类,分裂的原则是使每个子类内的样本更相近;再按步骤S2中的方式对新子类计算各自的样本特征中心Cb,f、样本特征尺度
和特征尺度Sb,f;分裂后的子类也要执行本步检测和决定是否需要继续分裂;S6、输入待识别目标的特征矢量,要求特征类型与训练样本的一致,计算该特征矢量到各个子类的偏离度,得到偏离度最小的那个子类的所属类就是识别到的类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奥普特科技股份有限公司,未经广东奥普特科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910027912.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种青稞网斑病的识别方法
- 下一篇:基于改进字典学习的多源图像目标关联方法