[发明专利]一种基于SSD的快速航拍车辆检测算法在审
申请号: | 201811546739.7 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109815799A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 韩静;柏连发;陈思瞳;张毅;陈霄宇;王灿龙 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 张学彪 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 航拍 特征提取模块 车辆检测 冗余 计算量 快速检测算法 特征表达 特征提取 网络参数 网络单元 增强特征 整体系统 算法 上层 场景 关联 网络 | ||
本发明公开了一种基于SSD的快速检测算法,为航拍的车辆检测提出了一种更快的特征提取模块以及针对航拍场景去掉了冗余的预选框,使整体速度得到显著的提升。具体地,我们提出一种名叫CE模块的网络单元,CE模块通过关联上层的信息来增强特征的表达能力,使得我们将网络参数变少时,对特征表达能力的影响非常小,这个方法显著地减少了特征提取网络的计算量。我们在更换特征提取模块的同时,也减少了冗余的预选框,进一步减少整体系统的计算量。
技术领域
本发明涉及一种基于SSD的快速航拍车辆检测算法。
背景技术
目前基于深度学习的目标检测算法分为两种思路,一种是基于区域候选框的目标检测,另一种是非区域候选框的目标检测。基于区域候选框的检测算法代表有Faster RCNN[1],Faster RCNN是基于RPN 的Fast RCNN的加速版,RPN使用卷积神经网络生成高质量的区域候选框,它和检测网络共享全图的卷积特征,可以使速度提升很大。
非区域候选框的代表算法有YOLO[3]和SSD[2],YOLO以整张图作为网络的输入,并且把目标检测问题转换成回归问题,虽然相比 Faster RCNN来讲速度提升很多,但是精度降低更明显。精度和速度依然不能达到一个平衡。SSD将Faster RCNN和YOLO结合在一起,将Faster RCNN最后的全连接层改为全卷积层,并提出了和Faster RCNN的anchor类似的prior box,特征图上的每一个像素点对应几个prior box,网络对prior box进行训练,通过Softmax分类和bounding box regression获得真实的目标位置。SSD检测算法的速度和YOLO 差不多,精度比YOLO提升很多,略低于Faster RCNN。
但以上算法仍然无法在移动平台上实现实时检测。于是,一些轻量级特征提取网络横空出世,比如SqueezeNet[6],MobileNet[7]和 ShuffleNet[8]等。SqueezeNet通过Fire Module替换传统的3x3卷积层来减少参数数量,以达到特征提取网络加速的效果。2017年Google 提出了深度可分离卷积网络MobileNet,MobileNet使用Deep-Wise 的卷积方式替代传统的3D卷积方式,减少了卷积核的冗余以及计算量,使得速度显著提升,而后的Mobilenet V2进一步在性能上提升。随后Face++提出ShuffleNet,ShuffleNet采用逐点分组卷积和信道混洗,把分组卷积后的特征图按通道进行均匀混合,以便更好地获取全局信息。这些均能使速度有所提升,但仍然达不到搭载低功耗平台的飞行器高效的航拍车辆检测的要求。
本发明参考借鉴了以下文献:
[1]Ren S,He K,Girshick R,et al.Faster R-CNN:Towards Real-Time ObjectDetection with Region Proposal Networks(基于区域特征网络的实时目标检测)[J].IEEE Trans Pattern Anal Mach Intell, 2015,39(6):1137-1149.
[2]Liu W,Anguelov D,Erhan D,et al.SSD:Single Shot MultiBox Detector(目标检]SSD)[J].2015:21-37.
[3]Redmon J,Divvala S,Girshick R,et al.You Only Look Once: Unified,Real-Time Object Detection(YOLO,实时目标检测方法)[C]// IEEE Conference onComputer Vision and Pattern Recognition.IEEE Computer Society,2016:779-788.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811546739.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无人机图像处理方法及系统
- 下一篇:基于回归算法的目标检测方法及系统