[发明专利]基于预分割和回归的深度学习目标检测方法在审

申请号：	201710598875.X	申请日：	2017-07-21
公开（公告）号：	CN107423760A	公开（公告）日：	2017-12-01
发明（设计）人：	孙伟;潘蓉;卞磊;王鹏	申请（专利权）人：	西安电子科技大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/32;G06K9/34;G06K9/46;G06N3/04
代理公司：	陕西电子工业专利中心61205	代理人：	王品华,朱红星
地址：	710071 陕***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于分割回归深度学习目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于图像信息处理领域，具体的说是一种深度学习目标检测方法，可用于对目标的精确实时定位和分类。

背景技术

目标检测是计算机视觉领域中一个富有挑战性的课题，其核心任务是在静态图片或者视频中使用某种目标识别算法和搜索策略，获取特定目标在图像或视频中的位置和类别。目前目标检测的方法主要分为基于特征及机器学习的目标检测算法和基于深度学习的检测方法。其中基于特征及机器学习的方法是通过对目标进行区域选择，特征提取、分类器分类等过程实现目标检测。区域选择是通过滑动窗口对整幅图像进行遍历选出可能存在目标的边框，但时间复杂度太高，冗余窗口过多，直接影响了特征提取和分类的速度和性能。特征提取中常用的特征有Haar小波特征、HOG特征、SIFT特征和混合特征等，由于图像的光照条件，背景和目标的形态等的多样性，对特征的鲁棒性要求比较高，提取的特征好坏直接影响目标分类的精度。传统的分类器主要包括支持向量机SVM和迭代器Adaboost。由于是针对某个特征的识别任务，模型泛化能力差，很难在实际应用中对目标精准识别。从2014年开始，基于深度学习的目标检测算法取得了重大的突破，克服了传统的目标检测算法中的缺点。目前主流的基于深度学习的目标检测算法主要分为两类：基于候选区域的深度学习目标检测算法和基于回归的深度学习目标检测算法。基于候选区域的目标检测算法的代表是R Girshick提出的R-CNN算法，该算法的检测框架结合候选区域和卷积神经网络CNN进行分类。由R-CNN逐步优化提速产生了SPP-NET,Fast R-CNN和Faster R-CNN，目标检测的精度和速度都有很大的提高，但由于此类方法进行目标检测时分为定位和分类两个步骤且定位耗时太长，因此不能实时地进行目标检测。基于回归方法的深度学习目标检测算法代表性的有YOLO和SSD，这类算法主要是通过回归法直接从待检测图像中预测目标的位置和类别，这种方法使得目标检测速度大大加快，可以达到实时目标检测的要求，但对输入图像的大小有严格要求并且目标位置定位较差，无法检测图像中的小目标。YOLO和SSD300分别要求输入图像尺寸为448*448和300*300，缩小待检测图像到特定尺寸，会丢失图像细节，导致无法检测到小目标。

发明内容

本发明的目的在于针对上述已有的技术问题，提出一种基于预分割和回归的深度学习的目标检测方法，以保存图像细节，提高对小目标的实时检测性能。

本发明的技术思路是通过在输入图像中进行四叉树预分割得到感兴趣区域；通过多尺度卷积层提取感兴趣区域的多尺度特征图；通过卷积滤波器预测目标类别和预测边框的位置；通过非极大值抑制得到最终的目标类别和目标位置坐标。

根据上述思路，本发明的实现方案包括如下：

(1)根据四叉树算法和卷积神经网络VGG-16建立基于预分割和回归的深度学习网络模型；

(2)在图像训练集上训练构建好的网络模型；

(2a)使用图像集PASCAL VOC2007和PASCAL VOC2012的训练数据集作为训练集，用图像集PASCAL VOC2007的测试数据集作为测试集；

(2b)对训练集中标注图像的标注边框和网络模型中生成的特征图上的默认边框进行匹配；

(2c)构造网络模型的目标损失函数L(x,l,c,g)；

其中，x为特征图上的默认边框，l为预测框，g为标注边框，c为特征图上的默认边框在每个类别上的类别得分集合，L_conf(x,c)表示特征图上的默认边框在类别得分集合c上的softmax分类损失函数，L_loc(x,l,g)表示定位损失函数，N表示与标注边框匹配的默认边框数，参数α通过交叉验证设置为1；

(2d)采用梯度下降法最小化损失函数同时对网络中的权重参数逐层反向调节，得到训练好的网络模型；

(3)将待检测的原始图像输入到训练好的网络模型中,得到待检测图像中的目标类别和位置坐标。

本发明具有如下优点：

1)本发明由于对待检测图像进行感兴趣区域预分割，避免了因图片过大而无法定位小目标的问题；

2)本发明中由于仅对感兴趣区域进行特征提取，而非对整个图像进行特征提取，降低了特征提取时的计算量和计算时间。

3)本发明由于使用卷积层提取感兴趣区域的特征，其特征具有位移、旋转和缩放不变性，避免了人工设计鲁棒性差的问题，更适合目标检测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710598875.X/2.html，转载请声明来源钻瓜专利网。