[发明专利]基于深度图的目标检测方法及存储介质有效
申请号: | 201811480757.X | 申请日: | 2018-12-05 |
公开(公告)号: | CN109784145B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 彭博文;王行;李骊;周晓军;盛赞;李朔;杨淼 | 申请(专利权)人: | 北京华捷艾米科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 目标 检测 方法 存储 介质 | ||
一种基于深度图像的特定目标检测方法及存储介质,所述方法为通过待测目标物体的尺寸定义真实候选框的尺寸,并计算候选框窗口遍历间隔;对深度图像进行遍历,获取候选框的中心点像素坐标;获取各候选框的中心点的深度值,筛选获得有效候选框;计算剩余的有效候选框的实际需要框长;设定过滤阈值,将有效候选框中深度与中心点的深度相差过大的点滤掉,后续可以进一步的进行深度学习预处理和深度学习。本发明能够尽可能增大图像遍历的步长,又可以过滤掉部分无效的候选框,根据中心点深度值按照目标物的真实尺寸计算出候选框的边长,可以防止在同一位置需要生成多尺度的候选框从而节约大量的计算量,为快速目标检测提供了很好的便利。
技术领域
本发明涉及图像检测领域,具体的,涉及一种基于深度图的目标检测方法,可以在深度图像上极大减少候选框的初始数量,从而大幅度降低模型计算次数提供检测效率。
背景技术
图像分类,检测及分割是计算机视觉领域的三大任务。而作为最基础的部分,当前主要的目标检测图像对象都是RGB图像,而结构光技术和TOF技术的发展,深度图像逐渐成为新的数据源。
近年来深度学习技术的飞速发展,图像中特定目标检测速度和精度有了大幅度的提高。但还远远不能达到视频图像的实时检测效果。但是相对于传统目标检测方案来说,基于深度学习的目标检测具有更高的精度以及更好的适应性。常用的图像目标检测算法采用以下几种方案:
目前基于深度学习模型的主流的目标检测算法,可以分成两大类:(1)two-stage检测算法,其将检测问题划分为两个阶段,首先产生候选区域(region proposals),然后对候选区域分类(一般还需要对位置精修),这类算法的典型代表是基于region proposal的R-CNN系算法,如R-CNN,Fast R-CNN,Faster R-CNN等;(2)one-stage检测算法,其不需要region proposal阶段,直接产生物体的类别概率和位置坐标值,比较典型的算法如YOLO和SSD。
上述方法完全依赖随机的候选框提取,存在以下缺陷:
(1)候选框随机性很大,对目标物体并没有针对性选择;
(2)候选框的大小需要进行多尺度选择,大大增加了候选框数量;
(3)候选框之间可能存在大量重叠、导致候选框数量增加;
(4)初始卷积图像过大,运算量大。
因此,在深度图像识别中如何减少候选框的数量,并且提高候选框与框中目标中间的重合度,使得在后续的卷积算法中降低运算量,快速的检测到物体,成为现有的图像识别技术亟需解决的技术问题。
发明内容
本发明的目的在于提出一种基于深度图的特定目标检测方法,利用了目标物体的真实尺寸信息,可以在深度图像上极大减少候选框的初始数量,从而大幅度降低模型计算次数提供检测效率。
为达此目的,本发明采用以下技术方案:
一种基于深度图像的特定目标检测方法,包括如下步骤:
遍历步长计算步骤S110:通过待测目标物体的尺寸L定义真实候选框的尺寸,并利用公式(1)计算得到候选框窗口遍历间隔StrideG,单位为像素
StrideG=0.5*L*fxy/D 公式(1)
其中,L为待测目标物体的尺寸,fxy为深度传感器的主距,单位为像素为单位,D为需要检测的目标物体的最远距离;
图像遍历步骤S120:根据真实候选框的尺寸,以及候选框窗口遍历间隔StrideG,对深度图像进行遍历,并获取所有候选框的中心点像素坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华捷艾米科技有限公司,未经北京华捷艾米科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811480757.X/2.html,转载请声明来源钻瓜专利网。