[发明专利]用于在数字图像中检测目标的方法、设备及计算机程序产品无效
申请号: | 201080059538.X | 申请日: | 2010-11-12 |
公开(公告)号: | CN102713934A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | P·米施拉;V·穆尼恩德尔;K·A·戈文达拉奥;R·诺普苏万查伊 | 申请(专利权)人: | 诺基亚公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 杨晓光;于静 |
地址: | 芬兰*** | 国省代码: | 芬兰;FI |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数字图像 检测 目标 方法 设备 计算机 程序 产品 | ||
相关申请的交叉引用
无。
技术领域
本公开一般涉及数字图像处理,并且更特别涉及用于在数字图像中检测目标的方法、设备及计算机程序产品。
背景技术
在数字图像处理的许多应用中,广泛使用目标检测。目标的例子可包括但不局限于,人的脸部,任何货物或车辆,或为安全目的被仔细检查的任何商品。目标检测例如脸部检测,可定义为定位在数字图像中脸部的存在。在数字图像中的脸部检测可用于例如脸部识别,脸部追踪,照片标记,图像检索,安全监视和例如脸部优先、自动聚焦和自动平衡等改进在照相机中的照片质量的应用中。
在多数数字图像处理应用中,目标检测由评估分类器(evaluating classifier)进入数字图像的不同部分执行。分类器对应于将在数字图像中检测的目标性质。分类器一般使用基于历史数据和学习算法从相似的数字图像中提取的特征创建。分类器在Viola.P等人在2004年发表在International Journal of Computer Vision第57卷第2期第137-154页的标题为“Robust Real-Time Face Detection”的论文中详细描述。分类器应用到数字图像内的子窗口(sub window)以用于检测目标的存在。进一步,为了在数字图像中的目标检测,该子窗口穿过数字图像逐步移动直到覆盖整个数字图像。
典型的数字图像示意性地表示在图1中。数字图像在X(宽)和Y(高)方向延伸。如图1所示,数字图像在整个宽度具有W像素且在整个深度具有H像素。多数目标检测技术使用经由分类器扫描整个数字图像。在一个这样的技术中,为子窗口计算强分类器(strong classifier)。子窗口可包括像素阵列,例如MxN像素,在其中M和N是整数。在一个技术中,子窗口以1个像素的步长穿过数字图像扫描。以1个像素的步长的数字图像的扫描表示子窗口在数字图像的每个像素上遍历(traverse)而不会跳过任何像素。进一步为在数字图像的每个像素的子窗口计算分类器的值。根据在给定像素的分类器的值,在给定像素上的检测窗口内检测出目标的存在。在这样的技术中,目标检测率很高,因为目标的存在是在数字图像的每个像素上检查的。在此,目标检测率指的是在数字图像中准确的目标检测百分比。进一步,在该技术中,目标检测时间正比于高度和宽度的乘积,例如在数字图像中像素的总个数,因为子窗口在数字图像的每个像素上扫描。
在另一个已知的技术中,数字图像由子窗口以超过1个像素(例如2个像素)的步长扫描。在该技术中,子窗口通过在数字图像中跳过1个像素遍历。相应地,在以2个像素步长扫描数字图像中所花费的时间比在以1个像素的步长扫描数字图像中所花费的时间小。然而,相对于1个像素的步长的目标检测率,当以2个像素的步长扫描时目标检测率变差。
在一个表示中,以1个像素的步长扫描数字图像所花费的时间可正比于W*H,然而以2个像素的步长扫描数字图像所花费的时间可正比于W/2*H/2。进一步,以1个像素的步长目标检测率可为“R%”,而以2个像素的步长的可近似为(R-10)%。在这些现有技术中,在目标检测率和扫描数字图像所花费的时间(处理时间)之间存在一个权衡(trade off)。例如,如果目标检测率增加,则处理时间也增加。
鉴于上述讨论,存在在数字图像中有效检测目标的需求。
发明内容
各种实施例的一般目的是为了描述用于在数字图像中检测目标的方法、设备及计算机程序产品。
一方面,提供了在具有多个像素的数字图像中用于检测目标的方法。所述方法包括提供该多个像素的MxN像素的检测窗口。进一步,所述方法包括通过以第一步长遍历检测窗口到在数字图像的一组像素上,确定在数字图像中的目标的至少一个区域。在这组像素的每个像素上,检测在检测窗口中的目标的至少一部分的存在。根据在该检测窗口中的目标的至少一部分存在的检测,该检测窗口以第二步长在邻近区域中移动。此外,所述方法包括在邻近像素上的每个检测窗口中检测目标的至少一部分的存在。而且,所述方法包括如果在邻近像素上至少阈值数的检测窗口存在目标的至少一部分,则选择所述检测窗口作为在数字图像中的目标的一个区域。其后,基于目标的至少一个区域,选择在数字图像中代表目标的目标区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080059538.X/2.html,转载请声明来源钻瓜专利网。