[发明专利]一种基于轻量级图像金字塔网络的单阶段物体检测方法有效
申请号: | 201910387974.2 | 申请日: | 2019-05-10 |
公开(公告)号: | CN110245655B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 庞彦伟;汪天才 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/52;G06V10/80;G06V10/774 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轻量级 图像 金字塔 网络 阶段 物体 检测 方法 | ||
本发明涉及一种基于轻量级图像金字塔网络的单阶段物体检测方法,包括下列步骤:选定合适的物体检测的数据集,数据集包含图片和标注,标注含有检测框的位置和物体类别;构建用于单阶段物体检测的三个网络:提取多尺度深层特征的主干网络、用于对检测框分类、回归的分类回归子网络和所提出的轻量级图像金字塔网络;选择合适的损失函数,物体检测任务中设计为多任务的损失函数,包括分类损失函数和检测框回归的损失函数,设计网络训练循环迭代的次数和网络最终收敛条件,并初始化网络参数;从数据集里选取训练图像,进行计算和训练。
技术领域
本发明属于深度学习和计算机视觉领域,特别涉及一种用于单阶段物体检测方法。
背景技术
通用物体检测是计算机视觉领域的一项重要的基础研究问题,在机器人科学、无人驾驶和视频监控等领域有着极其广泛的应用。近年来由于卷积神经网络在物体检测框架中的成功部署,通用物体检测性能取得了巨大的提升。
一般来说,深度学习类的物体检测方法可以被粗略地分为两大类,双阶段物体检测器[1]和单阶段物体检测器[2]。在双阶段物体检测方法中,物体检测问题被分成了两步:第一步是用区域建议网络产生一些候选区域,第二步对这些候选区域进行分类以及对候选区域位置进行回归和调整。单阶段方法和双阶段方法有所不同,直接在输入图像上采样默认的检测框,并对检测框直接进行回归。通常来说,单阶段检测器的检测速度快效率高,不过在检测精度上比双阶段检测器要差。
当前单阶段物体检测器能够实现速度和精度的很好的权衡,但是仍然不能很好地适应物体检测中大的尺度变化,而且在小尺度物体检测方面性能还远远不能满足需求。已有的物体检测算法利用特征金字塔网络[3,4]来解决多尺度问题和改善小尺度物体检测的性能。当前的单阶段物体检测算法没有专门利用传统的图像金字塔网络[5]来解决以上问题的方法,本专利提出一种用于单阶段物体检测器的轻量级图像金字塔网络。本专利在原有单阶段物体检测器架构的基础上,提出了一个轻量级的特征化图像金字塔网络,该网络能够产生一种新的多尺度特征表征,产生的多尺度特征能够和单阶段检测器产生的多尺度特征融合,显著增强特征的鉴别性,解决多尺度预测困难和小物体性能不足的问题。
参考文献:
[1]S.Ren,K.He,R.Girshick andJ.Sun.Faster R-CNN:towards real-timeobject detection with region proposal networks,International Conference onNeural Information Processing Systems.MITPress,2015:91-99.
[2]W.Liu,D.Anguelov,D.Erhan,C.Szegedy,S.Reed,C.Fu and A.Berg.SSD:Single ShotMultiBoxDetector,EuropeanConferenceonComputerVision,2015:21-37.
[3]T.Lin,P.Dollar,R.Girshick,K.He,B.Hariharan and S.Belongie.FeaturePyramid Networks forObjectDetection,InternationalConferenceonComputerVision,2016:936-944.
[4]Z.Cai,Q.Fan,R.Feris andN.Vasconcelos.A Unified Multi-scale DeepConvolutional Neural Network for Fast Object Detection,European Conference onComputer Vision.Springer,Cham,2016:354-370.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910387974.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序