[发明专利]一种级联检测中分块优化的方法在审
申请号: | 202010264078.X | 申请日: | 2020-04-07 |
公开(公告)号: | CN113554651A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 于晓静 | 申请(专利权)人: | 北京君正集成电路股份有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06T7/60 |
代理公司: | 北京智为时代知识产权代理事务所(普通合伙) 11498 | 代理人: | 王加岭;杨静 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 级联 检测 分块 优化 方法 | ||
本发明提供一种级联检测中分块优化的方法,所述方法包括以下步骤:S1,将图像分为16块,图像宽的方向分为四块,高的方向分为四块,确定图像金字塔列表里的最后三个;S2,所述16块的分块标准及块移按以下公式计算:(INPUT_W‑WLEN_W)/INC_W+1=FN_W 公式(1);(INPUT_H‑WLEN_H)/INC_H+1=FN_H 公式(2);INC_W=(INPUT_W–MIN_OBJECT_SIZE)/FN_W 公式(3);其中,INPUT_W/INPUT_H为输入图像的宽/高;WLEN_W/WLEN_H为分块的宽/高长度;INC_W/INC_H为块移;FN_W/FN_H是在横向/纵向要分的块数;MIN_OBJECT_SIZE为最小检测物体大小,其保证跨越两块之间的最小物体不漏检。由此,本申请的优势在于:通过分块优化的方式使得级联检测中的效得到大幅提升。
技术领域
本发明涉及神经网络领域,特别涉及一种级联检测中分块优化的方法。
背景技术
人工智能领域中神经网络技术日益发展迅猛。其中MTCNN技术也是近年来较为流行的技术之一。MTCNN,Multi-task convolutional neural network(多任务卷积神经网络),将人脸区域检测与人脸关键点检测放在了一起,总体可分为P-Net、R-Net、和O-Net三层网络结构。用于人脸检测任务的多任务神经网络模型,该模型主要采用了三个级联的网络,采用候选框加分类器的思想,进行快速高效的人脸检测。这三个级联的网络分别是快速生成候选窗口的P-Net、进行高精度候选窗口过滤选择的R-Net和生成最终边界框与人脸关键点的O-Net。
但是,在现有技术中,也存在如下缺点:当前深度学习算法如果不依赖GPU或NPU等硬件加速处理器在嵌入式平台上纯粹靠CPU运行会非常吃力,客户体验也会非常不好,CPU占用率居高不下,落地困难。
此外,现有技术中常用的技术术语包括:
级联卷积网络:就是设计N阶网络,由粗到精对任务进行处理。
图像金字塔:就是将图像按一定尺度进行变换,以适应对不同大小的人脸进行检测。
最小检测大小:如果检测目标宽高小于最小检测大小,模型没有检测能力。
发明内容
为了解决上述问题,本发明的目的在于:通过本方法实现依靠CPU工作就能够降低CPU负载,提升用户体验。
具体地,本发明提供一种级联检测中分块优化的方法,所述方法包括以下步骤:
S1,将图像分为16块,图像宽的方向分为四块,高的方向分为四块,确定图像金字塔列表里的最后三个;
S2,所述16块的分块标准及块移按以下公式计算:
(INPUT_W-WLEN_W)/INC_W+1=FN_W公式(1)
(INPUT_H-WLEN_H)/INC_H+1=FN_H公式(2)
INC_W=(INPUT_W–MIN_OBJECT_SIZE)/FN_W公式(3)
其中,
INPUT_W/INPUT_H为输入图像的宽/高;
WLEN_W/WLEN_H为分块的宽/高长度;
INC_W/INC_H为块移;
FN_W/FN_H是在横向/纵向要分的块数;
MIN_OBJECT_SIZE为最小检测物体大小,其保证跨越两块之间的最小物体不漏检。
由此,本申请的优势在于:通过分块优化的方式使得级联检测中的效得到大幅提升,充分考虑到了大小目标的检测范围,且与整帧检测效果没有差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京君正集成电路股份有限公司,未经北京君正集成电路股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010264078.X/2.html,转载请声明来源钻瓜专利网。