[发明专利]一种图像中的物体检测方法及装置有效
申请号: | 201611249792.1 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106803071B | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 杨松林 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/73 |
代理公司: | 11291 北京同达信恒知识产权代理有限公司 | 代理人: | 黄志华 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 中的 物体 检测 方法 装置 | ||
本发明实施例公开了一种图像中的物体检测方法及装置,用以提高目标检测的实时性。该方法中按照预设的划分方式,将待检测的图像划分为多个网格,将划分后的图像输入到预先训练完成的卷积神经网络中,获取卷积神经网络输出的所述图像的每个网格对应的特征向量,识别每个特征向量中类别参数的最大值,当该最大值大于设定阈值时,根据特征向量中中心点位置参数和外形尺寸参数,确定该类别参数对应的类别的物体的位置信息。由于本发明实施例中通过预先训练完成的卷积神经网络,确定图像中的物体的类别和位置,可以同时实现物体位置和类别的检测,无需选择多个特征区域,节省了检测的时间,提高了检测的实时性和检测的效率,并便于整体优化。
技术领域
本发明涉及机器学习技术领域,特别涉及一种图像中的物体检测方法及装置。
背景技术
随着视频监控技术的发展,智能视频监控应用在越来越多的场景中,例如交通、商场、医院、小区、公园等等,智能视频监控的应用为各种场景中,通过图像进行目标检测奠定了基础。
现有技术在图像中进行目标检测时,一般采用基于候选区域的卷积神经网络(Region Convolutional Neural Network,R-CNN)及其延伸Fast RCNN和FasterRCNN。图1为采用R-CNN进行物体检测的流程示意图,其检测过程包括:接收输入图像,在图像中提取候选区域(region proposal),计算每个候选区域的CNN特征,并采用分类和回归的方法确定物体的类型和位置。上述过程中,需要在图像中提取出2000个候选区域,整个提取的过程需要耗时1~2s的时间,然后针对每个候选区域,需要计算该候选区域的CNN特征,而候选区域中有很多是存在重叠的,因此在计算CNN特征时也会存在很多的重复工作;并且该检测过程中还包括后续步骤:proposal的特征学习,以及对确定的物体的位置进行校正和消除虚警等处理,整个检测过程可能需要2~40s的时间,大大影响了物体检测的实时性。
另外,采用R-CNN进行物体检测的过程中,图像的提取是采用显著性检测(selective search)提取的,之后采用卷积神经网络计算CNN特征,最后再使用支持向量机模型(SVM)进行分类,从而确定目标的位置。而上述三个步骤都是相互独立的方法,没办法对整个检测过程进行整体优化。
图2为采用Faster RCNN进行物体检测的过程示意图,该过程采用卷积神经网络进行,每个滑动窗在中间层(intermediate layer)将会生成一个256维的数据,在分类层(clslayer)检测物体的类别,在回归层(reg layer)检测物体的位置。上述对物体的类别和位置的检测是两个独立的步骤,两个步骤中都需要针对256维的数据分别进行检测,因此该过程也将会增长检测的时长,从而影响物体检测的实时性。
发明内容
本发明实施例公开了一种图像中的物体检测方法及装置,用以提高物体检测的实时性,并便于对物体检测进行整体优化。
为达到上述目的,本发明实施例公开了种图像中的物体检测方法,应用于电子设备,该方法包括:
按照预设的划分方式,将待检测的图像划分为多个网格,其中所述待检测的图像的尺寸为目标尺寸;
将划分后的图像输入到预先训练完成的卷积神经网络中,获取卷积神经网络输出的所述图像的多个特征向量,其中每个网格对应一个特征向量;
针对每个网格对应的特征向量,识别该特征向量中类别参数的最大值,当所述最大值大于设定阈值时,根据所述特征向量中中心点位置参数和外形尺寸参数,确定该类别参数对应类别的物体的位置信息。
进一步地,所述按照预设的划分方式,将待检测的图像划分为多个网格之前,所述方法还包括:
判断所述图像的尺寸是否为目标尺寸;
如果否,将所述图像的尺寸调整为目标尺寸。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611249792.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序