[发明专利]一种基于自适应卷积的快速目标检测方法有效
申请号: | 201910136780.5 | 申请日: | 2019-02-25 |
公开(公告)号: | CN109977774B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 凌强;陈春霖;李峰 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽;成金玉 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 卷积 快速 目标 检测 方法 | ||
1.一种基于自适应卷积的快速目标检测方法,其特征在于,步骤如下:
步骤1:获取带有标签的图像数据,构成训练集;
步骤2:提供一种自适应卷积模块,并基于自适应卷积模块构建目标检测网络,增强用于检测的特征的表达能力,提高检测精度,该目标检测网络将被用来预测待检测目标框的位置与所属于类别的得分;
步骤3:在步骤1构成的训练集上训练步骤2的目标检测网络,直到目标检测网络收敛,得到训练好的目标检测网络;
步骤4:利用训练好的目标检测网络对图像进行检测,得到所有检测结果,再使用非极大值抑制算法剔除重复结果,得到最终检测结果,检测结果包括目标框的位置和所属类别的得分;
所述步骤2中,所述自适应卷积模块,能根据输入的特征,动态地调整卷积滤波器的参数,学习到一组仅依赖输入数据的自适应卷积滤波器,这些滤波器能够适应输入图片场景的变化,自适应提取最合适的特征,抑制无关因素的影响;
所述自适应卷积模块的具体结构为:
X表示输入的特征图,其大小为Cin×H×W,Cin表示输入通道数,H,W分别表示其高和宽;L与W分别为中间结果,Y为自适应卷积模块的最终输出结果,其大小为Cout×H×W,Cout表示输出通道数,Cout取固定值256;
所述自适应卷积模块的处理过程为,首先对输入特征X进行均值降采样,得到大小为Cin×3×3的特征图L,然后在将L通过3*3的卷积层,得到W大小为Cw×3×3,W是动态学习到的卷积滤波器的参数集合,其中Cw=Cout×Cin;最后将输入特征X与W进行卷积得到最终的输出特征Y,卷积的计算方式如下:
其中,Yi表示Y的第i个通道,其取值范围为{1,2,3,…,Cout},同理Xj与也表示其对应的第j和第i*(Cin-1)+j个通道,*表示卷积操作。
2.根据权利要求1所述的基于自适应卷积的快速目标检测方法,其特征在于:所述基于自适应卷积模块构建目标检测网络实现为:
(1)采用常VGG16作为基础网络,前13层卷积层作为检测网络的基础部分,并在其后添加8层普通的卷积层,从而构成检测网络的主干网络部分;
(2)然后从主干网络中选取其中6层卷积层的输出作为检测用的6个特征图,6层卷积层的分别是Conv4_3,conv7,Conv8_2,Conv9_2,Conv10_2,Conv11_2,这6层输出的特征图的大小是逐渐减小的;
(3)将检测用的6个特征图分别输入到自适应卷积模块中,自适应卷积模块根据输入特征动态的调整卷积核滤波器的参数,以此来优化目标检测网络的特征的表达能力,提高检测效果;
(4)目标检测网络的输出结果将包括待检测目标框的位置和所属类别的得分,因此最后再利用通用卷积层来输出目标框的位置和类别得分,目标框的位置坐标包含四个数值(x,y,w,h),表示框的中心点横纵坐标以及宽高,而类别的得分将包含感兴趣目标的种类加上背景的得分。
3.根据权利要求1所述的基于自适应卷积的快速目标检测方法,其特征在于:所述步骤3中,在训练目标检测网络时,采用初始的基础学习率为0.001,该学习率应用到除了自适应卷积模块的其他所有层的学习中,而对于自适应卷积模块部分的学习率将采用基础学习率的二分之一,避免训练的震荡。
4.根据权利要求1所述的基于自适应卷积的快速目标检测方法,其特征在于:所述步骤4中,使用非极大值抑制剔除重复结果,具体如下:
(1)将所有检测结果中的目标框的分类得分低于设定第一阈值的删除掉;
(2)将剩下的所有目标框按照分类的得分高低依次排序;
(3)选取当前排序结果中得分最高的目标框保留下来,遍历剩下的目标框,若剩下的目标框与当前得分最高的目标框的重合比例超过第二阈值,则将该目标框删除;
(4)从未处理的目标框中继续选取一个得分最高的目标框,继续步骤(3),直到所有目标框都处理完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910136780.5/1.html,转载请声明来源钻瓜专利网。