[发明专利]一种基于二分查找的行人检测器训练方法及系统有效
申请号: | 201911327347.6 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111126247B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 傅红普;刘晴 | 申请(专利权)人: | 中南大学;湖南第一师范学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 龚燕妮 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二分 查找 行人 检测器 训练 方法 系统 | ||
本发明公开了一种基于二分查找的行人检测器训练方法及系统,该方法包括以下步骤:步骤1:构建样本训练集;步骤2:权重与决策桩桩号初始化;步骤3:构建有序特征值数组集合和伴随权重数组集合;步骤4:计算误差数组集合和极性数组集合;步骤5:获得最小误差数组;步骤6:利用最小误差数组中的最小误差,设置决策桩;步骤7:按照决策桩更新样本的权重,更新决策桩桩号;步骤8:判断决策桩桩号是否超过设定的最大桩号,若未超过,返回步骤3,否则,利用所有决策桩构建用于行人检测的检测器。使用变种二分查找获取最小误差数组,将查找操作的复杂度由O(n)降低为O(logn),加快了行人检测器的训练速度,且保持检测器性能不降低。
技术领域
本发明属于计算机视觉目标检测技术领域,特别涉及一种基于二分查找的行人检测器训练方法及系统。
背景技术
行人检测任务从图像中检测出行人的包围盒,参见文献1,可作为包括步态识别、自动驾驶、服务机器人等任务的计算机视觉关键环节,广受学术界和工业界关注。AdaBoost方法组合多个决策桩构造强分类器,并且只要求决策桩比随机猜测的性能好。AdaBoost并不依赖于决策桩分类精度的任何先验知识,它自适应地根据精度确定决策桩的权重。理论分析和实验研究都表明AdaBoost的泛化能力很强,参见文献2。在手工设计特征和深度学习特征框架中,AdaBoost分类器在行人检测上都展现出了优越的性能,参见文献3和文献4。
AdaBoost分类器形式为:其中,x表示样本,ht(x)是决策桩,αt是ht(x)的权重,T是分类器H包含的决策桩个数,为AdaBoost分类器的分类阈值。
训练通过贪婪地选择最优的决策桩ht(x)和设置相应权重αt来最小化损失函数。开始训练时,给每个训练样本xi一个非负权重wi。每次迭代训练后,AdaBoost方法自适应地降低正确分类样本的权重、提高错误分类样本的权重。每次迭代都在更新了样本权重的训练集上训练一个新决策桩。
训练AdaBoost分类器就是不断迭代训练决策桩直至训练误差达到指定值。决策桩由决策结点和两个保存结果的叶子结点构成。决策桩hj由特征fj、阈值θj、和极性pj∈{-1,1}三个参数描述:hj(x)=pjsign(fj(x)-θj),其中,x是以向量形式描述的样本,sign()是符号函数。
每次训练决策桩都是寻找在当前权重分布下的分类误差∈达到最小的决策桩。对样本权重归一化后,决策桩h的分类误差ε定义为:∑wi=1,其中,wi是每个样本当前的权重,1{x}是指示函数,自变量x为真时输出1,为假时输出0。
人们提出了很多方法来加快AdaBoost分类器的训练速度。这些方法大致可分为两类:一、基于特征和/或训练样本子采样的方法;二、提高决策桩训练速度的方法。前者如文献5和文献6,后者如文献7和文献8。因为样本集上特征值分布的随机性,现有方法使用顺序查找重复下述五个步骤训练各决策桩。
步骤G1:降低正确分类样本的权重,提高错误分类样本的权重;
步骤G2:对每个候选特征fi,按特征值升序排序得到样本编号序列;
步骤G3:对每个候选特征fi,依次以从小到大的特征值作为阈值,计算所有阈值对应的分类误差序列{εt};将特征值小于等于某个阈值θ的样本分类为正样本,其他样本分类为负样本,可计算出分类误差。也可以相反,就有另一个分类误差。选择误差小的分类方式作为阈值θ的分类,决策桩定义中的极性p记录该选择。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学;湖南第一师范学院,未经中南大学;湖南第一师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911327347.6/2.html,转载请声明来源钻瓜专利网。