[发明专利]一种基于混合空洞卷积金字塔的目标检测网络及方法有效
申请号: | 202110646653.7 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113392960B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 殷光强;殷康宁;候少麒;梁杰;丁一寅;曾宇昊 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/82;G06V10/80 |
代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 彭红艳 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 空洞 卷积 金字塔 目标 检测 网络 方法 | ||
1.一种基于混合空洞卷积金字塔的目标检测网络,其特征在于:包括主干网络、混合感受野模块、低层嵌入式特征金字塔模块和检测模块;所述主干网络使用分层级联的网络结构来提取目标图片特征;所述混合感受野模块用于将主干网络最顶端输出的最高层特征图进行特征增强;所述低层嵌入式特征金字塔模块在特征金字塔基础上,用于将高层特征向下融合,并通过低层嵌入的方式,生成最终的待检测特征图;所述检测模块用于将待检测特征图进行定位及分类,并输出结果;所述主干网络为基于Res2Net50网络的单阶段检测网络,在对目标的预测上,引入FCOS的Achor-free机制,进行逐像素点的预测,同时在Loss函数部分加入Centerness分支网络;所述混合感受野模块包括四个并行分支,包括一个1×1的卷积层分支和三个空洞率分别为1、2、4的3×3卷积层分支;所述混合感受野模块将不同空洞率的空洞卷积层并行获取的特征图拼接在一起后,采用1×1的卷积层进行特征信息融合,并将通道维度降低至指定数量;
所述低层嵌入式特征金字塔模块用于生成最终的待检测特征图,具体包括以下步骤:
a.低层嵌入式特征金字塔模块将当前层特征图与经过通道压缩和上采样后的高层特征图相融合,形成复合特征图,完成高层语义信息的嵌入;
b.将复合特征图和经过下采样的低层特征图相融合,形成混合特征图,完成低层细节信息的嵌入;
c.各混合特征图经过复合卷积层后,生成最终的待检测特征图;其中,复合卷积层由3×3卷积层、BN层和LeakyReLU激活层级联而成。
2.根据权利要求1所述的一种基于混合空洞卷积金字塔的目标检测网络,其特征在于:所述步骤a和步骤b中的融合方式为逐元素逐通道相加。
3.根据权利要求1所述的一种基于混合空洞卷积金字塔的目标检测网络,其特征在于:所述主干网络输出的特征图包括C3、C4和C5,所述特征图大小为100×100、50×50、25×25。
4.一种基于混合空洞卷积金字塔的目标检测方法,其特征在于:包括以下步骤:ⅰ.基于Achor-free机制搭建主干网络,经过主干网络得到特征图C3、C4和C5,主干网络输出的最高层特征图C5经过混合感受野模块进行特征增强后输出至低层嵌入式特征金字塔模块;所述主干网络可以为基于Res2Net50网络的单阶段检测网络,在对目标的预测上,引入FCOS的Achor-free机制,进行逐像素点的预测,同时在Loss函数部分加入Centerness分支网络;混合感受野模块由四个并行分支组成,一个1×1的卷积层分支,三个空洞率分别为1、2、4的3×3卷积层分支;所述混合感受野模块通过将不同空洞率的空洞卷积层并行获取的特征图拼接在一起,采用1×1的卷积层进行特征信息融合,并将通道维度降低至指定数量;
ⅱ.低层嵌入式特征金字塔模块与主干网络输出的特征图C4和C3通过上采样、下采样操作,形成复合特征,复合特征经过复合卷积层后生成待检测特征图,并将该待检测特征图输送至检测模块进行目标定位和分类任务;所述复合卷积层由3×3卷积层、BN层和LeakyReLU激活层级联而成;
ⅲ.训练上述网络,对每一轮的模型进行测试,保存最好的训练模型权重,并用相应的测试集测试混合感受野模块和低层嵌入式特征金字塔模块的实时性能,训练得到网络模型;
ⅳ.利用训练好的网络模型对目标进行检测,输出检测结果。
5.根据权利要求4所述的一种基于混合空洞卷积金字塔的目标检测方法,其特征在于:所述步骤ⅲ中训练网络的过程中,损失函数如下:
其中,px,y表示分类预测概率,tx,y表示回归预测坐标,N表示正样本数;k是指示函数,若确定当前预测为正样本则为1,否则为0;
Lcls为Focal Loss损失函数,具体表达形式为:
其中,y为样本标签,y’模型预测样本是正例的概率,γ为聚焦参数;
Lreg为GIoU Loss损失函数,具体计算过程为:
Lreg=1-GIoU
其中,A和B代表预测框和真实框,IoU是它们的交并比,先计算出它们的最小凸集C,即包围A、B的最小包围框,其次结合C这个最小凸集,计算出GIoU,从而计算出Lreg。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110646653.7/1.html,转载请声明来源钻瓜专利网。