[发明专利]一种多视角实时行人检测方法及系统在审
申请号: | 201510537625.6 | 申请日: | 2015-08-27 |
公开(公告)号: | CN105224911A | 公开(公告)日: | 2016-01-06 |
发明(设计)人: | 吴钊;熊伟;谷琼;胡春阳 | 申请(专利权)人: | 湖北文理学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/66 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 441053 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视角 实时 行人 检测 方法 系统 | ||
技术领域
本发明涉及计算机视觉目标检测技术领域,特别是涉及一种多视角实时行人检测方法及系统,尤其适用于实时统计公共场所的人流量数据。
背景技术
行人检测是计算机视觉与模式识别相结合的一个重要研究领域。行人检测的目标是在图像中标定出行人,例如尽可能紧凑的包含各个行人的矩形框。如果针对视频,有时还需要确定同一行人的运动轨迹,即行人跟踪。值得注意的是,检测不等于识别,不需要标定行人的身份信息。另一方面,检测通常是识别的先决条件,即首先确定包含某个行人的紧凑矩形区域,然后根据身份识别特征确定这个行人的身份。
行人检测较早的工作起始于90年代末,代表性的工作如MIT人工智能实验室的M.Oren和C.Papageorgiou等人在1998年提出的基于小波模板的行人检测。这种方法有两个主要特点:(1)使用了哈尔(Haar)特征区分行人自身的相似性和行人/背景间的差异性;(2)使用固定大小的滑动窗和全图比例缩放完成全图不同大小行人图像检测的任务。
行人检测的突破性进展来自P.Viola和M.Jones在2001年提出的基于类哈尔(Haar-like)特征和自举(Boosting)学习算法的目标检测。虽然P.Viola和M.Jones方法一开始的主要检测对象是人脸,但是很快就被用于检测其它目标,特别是行人目标。他们的方法的特点在于:(1)使用积分图(IntegralImage)计算类哈尔特征。积分图不仅仅是目标检测领域,也是更广泛的计算机视觉领域一个重要突破,现在积分图已经是目标检测的一个基本工具;(2)采用AdaBoost自动选取最有辨别能力的类哈尔特征。AdaBoost最初是仅用来提高简单学习算法(又称为弱分类器)的性能:将弱分类器线性组合成为一个强分类器。理论研究证明,强分类器在训练集上的检测错误(误警和漏报)随弱分类器的数量指数下降。此外,强分类器一般化的性能(测试集上的性能)也有理论保证;(3)采用了强分类器串联(cascading)的结构。一个检测窗当且仅当所有的强分类器都检测为+1才输出+1;任何一级强分类器检测为–1则立即退出检测器,输出为–1。
现有的行人检测还通常使用N.Dalal和B.Triggs在2005年提出梯度方向直方图(HistogramsofOrientedGradients,HOG)。HOG的基本出发点是目标的局部表观和形状特征可以通过局部图像梯度和边缘方向的分布刻画,而不需要确切的每个像素位置上的梯度和边缘方向。HOG结合了边缘方向直方图(Edge-OrientationHistograms),尺度不变特征变换(ScaleInvariantFeatureTransform,SIFT)描述符,以及形状背景(ShapeContexts)特征,与类哈尔特征相似,HOG特征也可以通过类似积分图的形式快速计算。与之前用在行人检测的特征相比,HOG特征都有显著的优势。到目前为止,HOG是用于行人检测性能最好的单独特征。
行人检测器有两个要素:特征和分类器。不同类型的特征之间有互补的关系,增加特征类型和数量会提高检测准确度但同时也会降低计算效率。也就是说,对于行人检测系统来说两个主要问题是:(1)如何提高检测准确度;(2)如何提高计算效率。同时这两个问题也是相互紧密联系的。
构造一个实用的行人检测器往往需要在复杂度和检测准确度之间权衡。一方面,面对行人的多姿态,多尺度,遮挡,复杂光照,和复杂背景,为了确保检测准确度,往往需要大量的特征,如Haar-like特征、HOG特征、Edgelet特征(描述行人局部轮廓方向的特征)、局部二元模式(LocalBinaryPattern,LBP)特征、协方差特征、身体部位特征等。增加特征通常可以提高检测准确度,但同时也意味着计算量的增加。另一方面,分类器也同时影响检测的准确度和效率。在搭建行人检测系统的时候,尽量考虑易于训练和实现、有快速算法的分类器。在一定的复杂度约束下,可以计算的特征数量有限,因此提高特征计算的效率间接的提高了分类器的准确度。特别是视频图像的行人检测,在实时的约束下,处理速度不能低于视频的帧率,限制了计算量,也间接的限制了检测的准确度。
除上述问题外,对于实用的行人检测系统来说,必须关注行人间及行人与物体间存在的遮挡问题。在单摄像机条件下,当前的方法能在一定程度上处理局部遮挡的问题,但效果并不理想。为解决该问题,目前多采用多摄像机或利用深度信息来检测行人。但这些方法大都假设场景中的目标是连续运动,并不对目标的类别进行判别,即只是利用多摄像机来对场景中连续运动的目标进行跟踪,而不是判断目标是否是行人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北文理学院,未经湖北文理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510537625.6/2.html,转载请声明来源钻瓜专利网。