[发明专利]一种基于GPU加速的Haar检测方法有效
申请号: | 201510479238.1 | 申请日: | 2015-08-03 |
公开(公告)号: | CN105160350B | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 曹泉;余坚毅 | 申请(专利权)人: | 深圳市哈工大交通电子技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市中闻律师事务所 11388 | 代理人: | 王红俊;常亚春 |
地址: | 518000 广东省深圳市南山区高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gpu 加速 haar 检测 方法 | ||
本发明公开了一种基于GPU加速的Haar检测方法,其特征在于,包括以下步骤:(1)系统初始化,CPU将所有放大系数下的扫描窗口、特征框信息以及分类器参数数据,传输并保存至GPU设备上;(2)按照图像矩阵的列数依次设置线程数并调用两次核函数,进行两次矩阵转置,得到图片的积分图和平方积分图;(3)将扫描窗口和特征矩形框排列在GPU全局内存中,进行haar算法检测;(4)将通过所有强分类器的扫描窗口进行矩形框合并,得到待检测结果。本发明在数据的准备方式、积分图的快速计算和分阶段针对性地实现Haar检测三个方面对现有haar算法进行了改进,使得haar算法的实现速度得到了极大的提升,实用价值得到了更充分的体现,具有很高的实用价值和推广价值。
技术领域
本发明涉及一种Haar检测方法,具体地说,是涉及一种基于GPU加速的Haar检测方法。
背景技术
Haar(哈尔)方法是一种利用Haar特征和级联分类器通过训练在图像上进行感兴趣物体检测的方法。Haar检测算法由于性能优异,被广泛应用,但是,其数据结构复杂,计算量大,实现速度较慢,无法满足快速检测的实际要求。
发明内容
本发明的目的在于提供一种一种基于GPU加速的Haar检测方法,解决现有技术中存在的haar算法实现速度慢、无法满足实际需求的问题。
为了实现上述目的,本发明采用的技术方案如下:
一种基于GPU加速的Haar检测方法,包括以下步骤:
(1)系统初始化,CPU将所有放大系数下的扫描窗口、特征框信息以及分类器参数数据,传输并保存至GPU设备上;
(2)按照图像矩阵的列数依次设置线程数并调用两次核函数,进行两次矩阵转置,得到图片的积分图和平方积分图;
(3)将扫描窗口和特征矩形框排列在GPU全局内存中,进行haar算法检测;
(4)将通过所有强分类器的扫描窗口进行矩形框合并,得到待检测结果。
进一步地,所述步骤(2)的具体方法如下:
首先,按照图像矩阵的列数依次设置线程数,调用核函数,依次纵向进行当前行和下一行的计算,然后进行矩阵转置;
然后,按照转置后的矩阵列数设置线程数,调用核函数,依次再进行当前行和下一行的计算,再进行矩阵转置,得到的矩阵即为所需要的积分图;
最后,采用同样的方式计算相应的平方积分图。
再进一步地,所述步骤(3)具体为:
a.配置GPU的网格数和块数,所有扫描窗口依次经过级联分类器的每一个强分类器,在经过级联分类器的至少前三个强分类器时,采用一个线程处理一个扫描窗口的并行方式进行计算,且每个线程中每个扫描窗口遍历当前强分类器的所有弱分类器,得到积分图特征值;
b.将积分图特征值与对应弱分类器阈值比较得到分值,各个弱分类器的分值累加的最终结果与对应强分类器的阈值比较,判断当前扫描窗口是否通过当前强分类器;
c.在扫描窗口经过级联分类器的至少后三个强分类器时,采用一个block计算一个扫描窗口,同一block内部的各个线程负责当前扫描窗口经过不同弱分类器的计算。
优选地,在所述步骤(3)中,下一级线程数由通过上一级强分类器的扫描窗口数目决定。
优选地,在扫描窗口经过所述步骤b与c之间的强分类器时,只需要调用一次核函数。
与现有技术相比,本发明具有以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市哈工大交通电子技术有限公司,未经深圳市哈工大交通电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510479238.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:锂离子二次电池
- 下一篇:直接甲醇燃料电池系统的阳极燃料补充控制方法