[发明专利]一种加快Adaboost训练速度与收敛速度的方法有效
申请号: | 201511005415.9 | 申请日: | 2015-12-29 |
公开(公告)号: | CN105654124B | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 田雨农;吴子章;周秀田;于维双;陆振波 | 申请(专利权)人: | 大连楼兰科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 毕进 |
地址: | 116023 辽宁省大连*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 加快 adaboost 训练 速度 收敛 方法 | ||
一种加快Adboost训练速度与收敛速度的方法,包括:引入边界条件调节权重的步骤;利用级联分类器之间集合关系减少重复计算的步骤;利用并行计算加速排序的步骤。在边界条件下,加快了训练程序的收敛速度,从而节省了大量训练开销,同时也减轻了使用分类器进行检测时的性能损耗。
技术领域
本发明属于目标检测领域,具体说是一种加快Adaboost训练速度与收敛速度的方法。
背景技术
随着Adaboost算法在人脸检测、行人检测、车辆检测及其他目标检测中的广泛应用,其算法的训练速度与收敛速度也逐步受到了越来越多的关注与研究。例如,有些改进算法中将权重调整偏向于分对的样本,这样促使训练的分类器具有相对更高的正样本检出能力;而有些算法中将权重调整偏向于分错的样本,这样则使训练得到的分类器对分错的样本具有更高的敏感性,也就相对降低了误识别率。然而正样本的检出率与负样本的误识别率本身就是一对矛盾,二者难以兼得。目前,现有的大多数改进算法主要针对如何将样本特征降维从而降低训练的计算代价,或采用分布式计算的方式解决级联分类器训练消耗资源多的问题。
发明内容
本发明提供了一种加快Adaboost训练速度与收敛速度的方法,在边界条件下,加快了训练程序的收敛速度,从而节省了大量训练开销,同时也减轻了使用分类器进行检测时的性能损耗。
为实现上述目的,本发明的技术方案是,一种加快Adaboost训练速度与收敛速度的方法,包括:引入边界条件调节权重的步骤;利用级联分类器之间集合关系减少重复计算的步骤;利用并行计算加速排序的步骤。
进一步的,所述的引入边界条件调节权重的步骤,首先,定义两种边界条件:边界条件1,负样本的误识别率满足退出条件,正样本的检出率接近于退出条件;边界条件2,负样本的误识别率接近于退出条件,正样本的检出率满足退出条件;在保持权重总和不变的前提下,将满足一定条件的权重调整引入反馈,从而有方向性地增大分错的正样本的的权重比例,使正样本的检出率更加容易达到要求;
进一步的,所述接近于退出条件是指相差0.1%以内;
进一步的,对于弱分类器的权重调节过程,步骤如下:
S1:首先,对样本权重进行初始化;
S2:然后,进行弱分类器的训练,将训练得到的弱分类器作用于样本,检测哪些样本被正确分类,哪些被错误分类;
S3:对于错误分类的样本其权重增加,正确分类的样本权重减少,然后进行权重归一化;
S4:计算正样本的检出率与负样本的误识别率,判断是否满足预先设定好的退出条件。
进一步的,在步骤S4中,如果满足就直接退出本级强分类器的训练;否则:
判断是否满足边界条件1,如果满足则增大分错的正样本权重比例并进行权重归一化;
判断是否满足边界条件2,如果满足则增大分错的负样本权重比例并进行权重归一化;
既不满足边界条件1也不满足边界条件2则进入下一级弱分类器的训练。
进一步的,利用级联分类器减少重复计算的步骤为,在每一级强分类器的第一个弱分类器中对样本进行各个特征维度的排序,并且将排序结果记录下来。
进一步的,同时,记录下排序的样本的索引信息。
作为更进一步的,利用级联分类器之间集合关系减少重复计算的步骤为,将原样本的特征维度进行拆分,根据训练程序所在环境的处理器情况拆分为S份,针对每一份特征维度都启用一个线程进行排序、计算每个样本的分错样本权重和,然后再将各个线程计算的结果进行合并,即可找出全局最小的分错样本权重之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连楼兰科技股份有限公司,未经大连楼兰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511005415.9/2.html,转载请声明来源钻瓜专利网。