[发明专利]一种基于特征尺度和子类分裂的分类器在审
申请号: | 201910027912.0 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109784398A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 朱杰英;卢盛林 | 申请(专利权)人: | 广东奥普特科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 潘俊达 |
地址: | 523000 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子类 特征尺度 分类器 偏离度 特征矢量 度量 分裂 样本 机器视觉技术 分类过程 模式识别 样本中心 异类样本 受限制 正确率 归类 下界 偏离 检测 | ||
本发明属于模式识别和机器视觉技术领域,具体涉及一种基于特征尺度和子类分裂的分类器的实现方法。该分类器在训练时,先将每个类看作一个子类,每个子类的每个特征都有各自的特征尺度,特征尺度是用来度量一个特征矢量到一个子类的样本中心的偏离度的,是有下界限定的。如果类内的样本形态并不单一,还要检测每个子类的相近的异类样本的偏离度比值来决定是否对其分裂成更多的子类。分类过程就是目标的特征矢量离哪个子类的偏离度值最小,就归类到该子类所属的类。本分类器的优势在于识别正确率高,特征范围量级、样本形态和分布均不受限制、且可度量到一个类的偏离程度。
技术领域
本发明属于模式识别和机器视觉技术领域,具体涉及一种基于特征尺度和子类分裂的分类器的实现方法。
背景技术
模式识别是根据输入的目标信息对目标进行识别或归类;识别和分类在机器视觉里也经常用到。要实现分类就需要建立分类器,常见的分类器有支撑向量机(SupportVector Machine,SVM)、多层感知机(Multi-Layer Perceptron,MLP)、K-近邻(KNN)、高斯混合模型(GMM)、最小距离法等等。很多情况下,用来分类的特征类型并不是只有一种,而不同种类的特征在范围量级上一般也各不相同,因此,相同的差值在不同种类的特征上代表的距离并不一定等价,而多数的分类器内部并没有考虑这个问题,有考虑也是用样本标准差、方差或协方差来对输入的特征值进行归一化;而这些归一化尺度如果在所有样本上统计则受各个类的样本特征分布的影响比较大,准确性会差,如果在单个类上统计则受较小的归一化尺度值的影响大,稳定性比较差。另外如果类内的样本差异不大,可以通过计算和查找离哪个的类的样本特征中心的距离最近就归到哪个类;但如果类内样本差异很大,呈现多态的时候,类内只一个样本中心是不够的;可以把每个样本作为一个中心,比如KNN的方式,但按KNN分类时计算量大且每个类的样本容量要分布比较平衡才好;也可以对每个类的样本自动聚类成若干子类,但聚类为多少个子类要手动设置且不一定很合适。因此,亟需对目前的分类器作一些改进。
发明内容
针对现有技术的不足,构造一种基于特征尺度和子类分裂的分类器:针对特征的量级差异,对特征尺度设置下界来达到稳定计算和提高分类正确率的目的;针对类内样本多态的情况,依据监测样本到异类和自身类的偏离度比值,采取递归分裂子类的方式来降低误分的几率;针对周期性特征,在计算距离和统计参数时给出更合理的计算方式。
为实现上述目的,本发明采用如下技术方案:
本发明的分类器的训练和识别的步骤如下:
S1、输入所有训练样本的特征矢量和类别名;计算每个特征在所有样本上的范围长度Rf=maxsXs,f-minsXs,f,其中Xs,f表示第s个样本的第f个特征值;然后对于Rf等于或接近0的,也即Rf≤δf,设置该特征权值wf=0,当作无效特征,否则设置wf=1,其中δf是一个远比特征值域长度小的正数;
S2、将每个类看作一个子类,对每个子类计算样本特征中心Cb,f和样本特征尺度首先计算出样本特征中心再计算样本特征尺度其中N为该子类的样本总数,X为特征值,b为子类序号,s为样本序号,p为正整数;
S3、计算每个有效特征的特征尺度下界Lf,可选择以下两种方式之一进行计算,但如果平均每一类的不同特征的样本数<2,只能使用S31的方式计算:
S31、Lf=βfRf,其中0<βf≤0.1,βf的值需手动调试或者使用经验值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奥普特科技股份有限公司,未经广东奥普特科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910027912.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种青稞网斑病的识别方法
- 下一篇:基于改进字典学习的多源图像目标关联方法