[发明专利]一种基于混合空洞卷积金字塔的目标检测网络及方法有效
申请号: | 202110646653.7 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113392960B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 殷光强;殷康宁;候少麒;梁杰;丁一寅;曾宇昊 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/82;G06V10/80 |
代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 彭红艳 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 空洞 卷积 金字塔 目标 检测 网络 方法 | ||
本发明涉及数字图像处理技术领域,特别是涉及一种基于混合空洞卷积金字塔的目标检测网络及方法,所述目标检测网络包括主干网络、混合感受野模块、低层嵌入式特征金字塔模块和检测模块;所述主干网络使用分层级联的网络结构来提取目标图片特征;所述混合感受野模块将主干网络最顶端输出的最高层特征图进行特征增强;所述低层嵌入式特征金字塔模块在特征金字塔基础上,将高层特征向下融合,并通过低层嵌入的方式,生成最终的待检测特征图;所述检测模块将待检测特征图进行定位及分类,并输出结果。通过本目标检测网络及方法,能有效解决因尺度和遮挡引起的漏检、错检的问题。
技术领域
本发明涉及数字图像处理技术领域,特别是涉及一种基于混合空洞卷积金字塔的目标检测网络及方法。
背景技术
目标检测是现实生活中最广泛的应用之一,其任务在于关注图片中的特定目标。传统的目标检测方法可以划分为单阶段目标检测方法和两阶段目标检测方法,两阶段方法其核心是采用区域提议方法,对输入图像进行选择性搜索并生成区域建议框,然后对每一个区域建议框使用卷积神经网络提取特征,再使用分类器进行分类。单阶段方法则是经过卷积神经网络直接输出目标检测结果。
经过一系列的变种,这两类方法的共同点逐渐演变为在检测过程中都需要预先生成大量锚框,这些算法统称为Anchor-based目标检测算法。锚框是在训练之前,在训练集上利用聚类算法得出的一组矩形框,代表数据集中目标主要分布的长宽尺寸。在推理时先在特征图上由这些锚框提取n个候选矩形框,再对这些矩形框做进一步的分类和回归。相对两阶段算法来说,对候选框的处理依然经过前背景粗分类和多类别细分类两步。
单阶段目标检测算法由于缺少了两阶段算法的精细处理,在面对目标多尺度、遮挡等问题时表现不佳。另外,Anchor-based算法虽然在一定程度上缓解了选择性搜索带来的候选框计算量爆炸的问题,但每个网格中大量不同尺寸锚框的生成仍然造成了计算冗余,最重要的是锚框的生成依赖于大量的超参设置,手动调参会严重影响目标的定位精度和分类效果。
现有技术中,公开号为CN110222712A的专利公开了“一种基于深度学习的多专项目标检测算法”,其提出的目标检测算法通过多尺度滑动窗口和选择性搜索得到增广的RoI集,并且通过穷举的方式接手多尺度滑动窗口生成密集的RoI集,计算量大且效率低下。
公开号为CN112115883A的专利公开了一种“基于Anchor-free目标检测算法的非极大值抑制方法和装置”,其提出利用CenterNet网络模型通过预测出物体的左上角点、右下角点和物体的中心点来进行目标检测,采用非极大值抑制方法避免出现同一目标物存在多个检测框的情况,但是需要更复杂的后处理,才能将属于同一目标的各对角点归为一组,效率较低。
公开号为CN112101153A的专利公开了一种“基于感受野模块与多重特征金字塔的遥感目标检测方法”,其通过VGG网络对可见光遥感图像进行特征提取,得到不同尺寸的特征图,然后将这些特征图进行级联融合并通过步长卷积特征金字塔,得到优化特征图,再经过感受野信息挖掘,最后进行多尺度输出检测。该方法利用了不同尺寸的特征图,但是特征图融合方式较为冗余,且主干网络性能不佳,影响最终检测结果。
发明内容
为解决上述技术问题,本发明提出了一种基于混合空洞卷积金字塔的目标检测网络及方法,能有效解决因尺度和遮挡引起的漏检、错检的问题。
本发明是通过采用下述技术方案实现的:
一种基于混合空洞卷积金字塔的目标检测网络,其特征在于:包括主干网络、混合感受野模块、低层嵌入式特征金字塔模块和检测模块;所述主干网络使用分层级联的网络结构来提取目标图片特征;所述混合感受野模块用于将主干网络最顶端输出的最高层特征图进行特征增强;所述低层嵌入式特征金字塔模块在特征金字塔基础上,用于将高层特征向下融合,并通过低层嵌入的方式,生成最终的待检测特征图;所述检测模块用于将待检测特征图进行定位及分类,并输出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110646653.7/2.html,转载请声明来源钻瓜专利网。