[发明专利]单指令多数据处理单元和在图像中执行对象检测的方法在审
申请号: | 202011443846.4 | 申请日: | 2015-12-11 |
公开(公告)号: | CN112560643A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | S·塞法尔瓦伊 | 申请(专利权)人: | 想象技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F9/38;G06K9/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 吕俊刚 |
地址: | 英国赫*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指令 多数 处理 单元 图像 执行 对象 检测 方法 | ||
本发明涉及单指令多数据处理单元和在图像中执行对象检测的方法。单指令多数据处理单元包括:一组计算单元,所述一组计算单元能够操作以并行地执行多个分类器序列,每个分类器序列都包括多个分类器程序,并且每个分类器程序都包括与所述多个分类器序列中的每个分类器序列中的其它分类器程序相同的指令;其中,每个计算单元被配置成在所述计算单元上独立地保持识别正在测试的图像区域和特征的数据,并且每个分类器程序被布置成存取所述数据,针对所识别的图像区域测试所识别的特征,并且更新所述数据,使得所述计算单元能够操作以针对不同的图像区域同时测试不同的特征。
本申请是原案申请号为201510919951.3的发明专利申请(申请日:2015年12月11日,发明名称:单指令多数据处理单元和在图像中执行对象检测的方法)的分案申请。
技术领域
本发明涉及一种SIMD处理单元和用于执行对象检测的方法。
背景技术
用于执行自动人脸检测的很多现代方法都基于Viola-Jones对象检测框架,该Viola-Jones对象检测框架在P.Viola和M.Jones的论文“Robust realtime facedetection”(International Journal of Computer Vision,第57卷,第2章,第137-154页,2004年)中描述。Viola-Jones框架对针对图像定义的图像区域或者“子窗口”的集合操作,每个窗口在图像内都具有不同位置、尺度或者旋转角度,以允许检测在不同位置处或者具有不同尺寸和旋转角度的人脸。二元分类器(binary classifier)的级联集合对每个子窗口操作,以检测在图像中子窗口是否有可能包围人脸。每个二元分类器都对子窗口执行测试,以确定子窗口是否满足一个或更多个简单视觉特征(通常称为“Haar-like特征”)。如果子窗口满足一个或更多个简单视觉特征,则二元分类器接受(pass)该子窗口,并且移动到级联中的下一个二元分类器。当级联的所有二元分类器都接受子窗口时,该子窗口变为用于正被搜索的图像中的人脸的候选。如果级联中的任何二元分类器都拒绝子窗口,则不对该子窗口执行进一步处理,级联终止并且级联处理再次开始于下一个子窗口。
图2中示出在Viola-Jones框架中通常使用的四个视觉特征201-204。图2中所示的特征201至204中的每个特征在视觉上表示如何处理子窗口的像素值以测试子窗口。例如,特征201可以表示级联的分类器中的第一二元分类器的组成,并且通过从位于特征的无阴影区域(子窗口的左手侧)中的子窗口的像素值的总和减去位于特征的阴影区域中的子窗口的像素值的总和(子窗口的右手侧)来计算。如果该特征评估为超过预定义阈值(通常通过在测试图像上训练人脸检测器来建立)的值,则认为该子窗口满足视觉特征并且二元分类器接受该子窗口。通常,二元分类器对已被处理以仅表示亮度或者灰度信息的图像(例如,像素值可以是亮度值)的子窗口进行操作。以此方式,级联的二元分类器起作用,以识别指示人脸特征的图像中的对比度的特定图案。
为了改进人脸检测系统的性能,可以通过将多组线程分配给GPU,在图形处理单元(GPU)处并行地执行根据Viola-Jones对象检测框架执行的二元分类器操作。然而,该方法可能导致GPU的并行处理元件在很大比例的时间内为空闲的。这是因为一组线程的并行处理通常未完成,直到一组线程的每一个线程的处理完成为止,并且如果子窗口不接受(fail)级联的第一二元分类器,则对该子窗口操作的任何给定线程可以几乎立即终止,或者如果其可以完成级联的所有二元分类器的处理,则该子窗口表示人脸候选。处理资源的该未充分使用对使用Viola-Jones框架特别是对移动和低功率平台实时地执行人脸检测呈现困难。
解决该问题的先前努力试图将二元分类器的性能分解到多级,诸如,在2011年Elsevier公司的Wen-mei W.Hwu作出的“GPU Computing Gems”的第534-541页描述的Nvidia CUDA实现。然而,这仅部分地解决该问题,引入了用于在多级之间压缩数据的附加开销,并且具有在较早处理阶段期间效率低的缺点。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于想象技术有限公司,未经想象技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011443846.4/2.html,转载请声明来源钻瓜专利网。