[发明专利]一种基于随机蕨的自举弱学习方法及其分类器有效

专利信息
申请号: 201210180065.X 申请日: 2012-06-04
公开(公告)号: CN102708384A 公开(公告)日: 2012-10-03
发明(设计)人: 权伟;陈锦雄;余南阳;刘彬 申请(专利权)人: 西南交通大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 成都博通专利事务所 51208 代理人: 林毓安
地址: 610031 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 随机 学习方法 及其 分类
【说明书】:

技术领域

发明属于计算机图形图像模式识别技术领域,特别涉及机器学习,计算机视觉技术。

背景技术

随着计算机技术的发展,研究复杂的信息处理过程成为可能。信息处理过程的一个重要形式就是模式识别,即主体对环境及客体的识别,而分类过程则是模式识别的基本任务。目前,Boosting自举分类方法(这里主要指AdaBoost自适应自举方法)因其在检测和识别中的实际应用能力,在模式识别和机器学习任务中得到越来越广泛的应用,如医学图像分析,光学文字识别,语音识别,手写识别,人脸识别,指纹识别,虹膜识别,文件分类,摄影测量与遥感,互联网搜索引擎,信用评分等。在Boosting自举分类器的训练过程中,不同的弱学习方法将决定Boosting自举分类器的训练速度,收敛性和准确率。弱学习方法主要基于特征的选择和阈值的确定。

Leshem将AdaBoost算法应用到交通管理信息系统中,利用弱学习器来训练道路交通数据,并且预测道路交通流量情况,取得良好的效果。Lin将RealAdaBoost算法应用到基于内容的图像检索系统中,通过对图像的类别短语进行训练,达到降低噪声的效果,实验表明比KNN(K-nearest Neighbor)分类算法准确性有所提高。Dai等人将AdaBoost算法应用到区域图像检索中,通过使用AdaBoost弱分类器对特征反复训练,得到具有较小错分率的强分类器,从而返回更加精确的查询结果。为了解决不同的特征融合分类问题,Yin等人提出了一种改进的boosting算法,使用一个弱分类器仅对某一个特征集进行训练,最终根据权重将这些弱分类器组合成一个强分类器,该方法在手写数字识别中取得了较好的效果。Viola等人提出了的样本权重更新方法,被正确分类样本权重减小,而错误分类样本权重不变。AdaBoost在学习训练的过程中要解决的是每一轮样本训练集的样本分布问题,其中正负样本的权重更新及错分率的处理至关重要。对样本进行两类划分,以便保证弱分类器分得的样本准确率大于随机猜测的准确率。李闯等人提出了针对目标检测问题的改进AdaBoost算法,采用了新的参数求解方法,弱分类器的加权参数不但与错分率有关,还与其对正样本的识别能力有关。Kim等人提出了特征值是基于高斯概率分布的AdaBoost算法,通过特征值的分布与高斯概率分布的均值距离来判别正负样本。谢红跃等人提出一种AdaBoost样本阈值和偏置计算方法,该方法依据样本权重的大小计算出对应的样本阈值,并用来区分正确分类和错误分类的样本,从而使得弱分类器划分准确性大于50%。钟向阳等人提出基于多阈值弱学习的Adaboost检测器,该方法采用分类树作为弱学习器,以贪婪的方法用误差测度减少最大化的划分准则划分节点,并由此生成弱分类器,然后采用RAB或GAB方法在给定数据和标签的训练集上将这些弱分类器提升为强分类器。但是,这些弱学习方法要么收敛速度慢,要么准确率不够高,要么计算效率低。

鉴于以上方法的不足,本发明提出基于随机蕨的自举弱学习方法,该方法收敛速度快,计算效率高,且最终得到的自举分类器准确率高。本发明方法采用的图像特征融合局部二元模式特征(LBP)和类哈尔特征(haar-like),对对象局部区域进行测量并编码;然后,将样例对应的特征值作为随机蕨的样本输入,随机蕨对所有编码进行计数;接着,根据随机蕨记录的样本分布,选择最好的编码作为该特征对应的判别特征值(阈值);最后,将得到的基于这种特征值编码的随机蕨弱分类器作为预测函数加入到自举算法框架中,其余处理过程与自适应自举算法一致,最终得到一个强分类器。因此,本发明方法可以很好地解决成像环境复杂且对运算量要求严格的图像模式识别问题。此外,本发明方法同时适合于离线和在线自举分类器训练。

发明内容

本发明的目的是提供一种基于随机蕨的自举弱学习方法及其分类器,它能实现快速收敛和高效的自举弱学习方法,得到实时处理且准确率高的分类器。

本发明实现是发明目的所采用的技术方案是:一种基于随机蕨的自举弱学习方法及其分类器,所述方法包括如下内容:

(1)选择图像特征和构造随机蕨

采用的图像特征融合局部二元模式特征(LBP)和类哈尔特征(haar-like),这些特征对图像区域的梯度方向进行测量,并量化输出8种可能的编码,如图1、图2和图3所示,它们均为矩形特征。具体来说,先分别按照水平方向,垂直方向和对角方向将矩形区域平分为两部分,分别标记为白色和黑色,然后,计算白色矩形像素值的和减去黑色矩形像素值的和,该值如果大于0,则编码为1,否则为0。因此,对于一个特征,3个方向得到3位的二进制编码,即23=8种可能的值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210180065.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top