[发明专利]一种基于自适应卷积的快速目标检测方法有效
申请号: | 201910136780.5 | 申请日: | 2019-02-25 |
公开(公告)号: | CN109977774B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 凌强;陈春霖;李峰 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽;成金玉 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 卷积 快速 目标 检测 方法 | ||
本发明涉及一种基于自适应卷积的快速目标检测方法,步骤为:获取带有标签的图像数据,构成训练集;构建基于自适应卷积模块的目标检测网络;在构成的训练集上训练所提出的目标检测网络,直到目标检测网络收敛,得到训练好的目标检测网络;利用训练好的目标检测网络对图像进行检测,剔除重复结果,输出最终结果。本发明通过动态地调整卷积滤波器的参数,来改善检测网络提取特征的表达能力,抑制无关的干扰特征,增强感兴趣目标的特征响应,使提取的特征更加适合当前场景检测需要,提高其对复杂场景下的小尺度目标的检测性能。
技术领域
本发明涉及一种基于自适应卷积的快速目标检测方法,属于数字图像处理、目标检测和深度学习技术领域。
背景技术
目标检测是一项基础的计算机视觉感知任务,在自动驾驶、人脸识别、交通视频监控等领域都具有广泛的应用。因此提高目标检测的精度和速度是一个重要的研究问题。
近年来,随着深度学习技术的蓬勃发展,计算机视觉取得了巨大的突破,许多先进的视觉感知算法被提出来。其中,目标检测作为一项基础任务,受到了许多研究者的关注,因此也提出了一系列的高效检测算法。现有的检测算法大致可以分为两大类:两阶段法和单阶段法。
第一类是两阶段法,这类方法首先通过一个单独的区域推荐网络RPN来产生稀疏的候选框集合;然后在利用RCNN分别对每一个候选框进行进一步的特征提取,然后分类和位置回归。该类方法通常能取得较高的检测精度,但是由于网络结构较复杂,处理速度很慢,一般很难达到实时处理。文章【1】提出了直接使用主干网络的顶层特征来作为RPN和RCNN的输入特征图,该方法较简单,但是由于特定某一层的卷积层的感受野大小是固定的,用来检测不同尺度的目标是不理想的,对于过大或过小的目标性能都比较差。文章【2】采用特征金字塔网络来融合来自高层的语义信息,改善不同尺度下的目标检测问题。
第二类方法是单阶段法,这类方法的检测网络只会前向传播一次,通过对图像区域的密集采样,产生大量的预测框,对每一个可能的位置都尽可能的进行位置回归和分类。该类方法由于网络简单,处理速度往往很快,在各种实时性要求较高的场景有较大的应用前景。文章【3】将图像分割成7*7个区域,每个区域内输出两个可能的目标位置,该方法由于产生的候选框集合过于稀疏,预测精度较低。文章【4】采用多层特征预测的方法来处理不同尺度下的目标检测问题,浅层的特征用于检测小尺度目标,深层的特征用于检测较大尺度的目标,该方法的速度和精度都取得了一个不错的进步,得到了大量的研究和应用,但是由于浅层网络的感受野有限,其特征包含大量简陋的低层特征和干扰信息,对小尺度目标的定位有较大的影响,导致其小尺度检测性能较差。文章【5】在【4】的基础上进一步改进,利用反卷积层搭建了一个对称的沙漏网络,将高层的特征与低层特征进行融合,在精度上取得了进一步的提高,但是由于网络更加复杂,预测框采样更加密集,算法的耗时巨大,在实际使用中很难得到应用。
【1】Ren S,He K,Girshick R,et al.Faster r-cnn:Towards real-time objectdetection with region proposal networks[C]//Advances in neural informationprocessing systems.2015:91-99.
【2】Lin T Y,Dollár P,Girshick R,et al.Feature pyramid networks forobject detection[C]//CVPR.2017,1(2):4.
【3】Redmon J,Divvala S,Girshick R,et al.You only look once:Unified,real-time object detection[C]//Proceedings of the IEEE conference on computervision and pattern recognition.2016:779-788.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910136780.5/2.html,转载请声明来源钻瓜专利网。