[发明专利]融合多尺度上下文特征和通道增强的遥感图像目标检测方法在审
申请号: | 202310314455.X | 申请日: | 2023-03-28 |
公开(公告)号: | CN116246173A | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 马学森;董金殿;马吉;许雪梅;蒋功辉;周天保;郑彪;钟智能;彭行浩;虞秀轩;李景奇 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/80;G06V10/82;G06N3/08;G06N3/0464 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 尺度 上下文 特征 通道 增强 遥感 图像 目标 检测 方法 | ||
1.一种融合多尺度上下文特征和通道增强的遥感图像目标检测方法,其特征在于,是按如下步骤进行:
步骤1、获取带有目标真实框的遥感图像数据集记为T={Tn|n=1,2,…,N},其中,Tn表示第n张遥感图像;N表示遥感图像的数量;
步骤2、构建遥感图像目标检测网络,包括:特征提取模块f、多尺度上下文增强模块g、空间金字塔通道增强模块e、检测头模块u,并将所述遥感图像数据集T输入到所述遥感图像目标检测网络中;
步骤2.1、所述特征提取网络f包括:一个直连块d和I个跳连块D,且直连块和第一个跳连块之间设置有一个最大池化层Pmax,所述直连块d依次包含:卷积层、归一化层和激活层,任意一个跳连块D由多个直连块级联构成,并采用局部残差方式连接;
所述特征提取网络f的输入端为所述直连块d的输入端;所述直连块d的输出端与所述最大池化层Pmax的输入端连接,最大池化层Pmax的输出端与所述第1个跳连块D1的输入端连接,且采用残差连接结构,即:最大池化层Pmax的输出端与第1个跳连块D1的输入端连接,并经过第1个跳连块D1中的多个直连块后,与第2个跳连块D2的输入端连接,同时,最大池化层Pmax的输出端跳过第1个跳连块D1直接与第2个跳连块D2的输入端连接;
第i个跳连块Di的输出端与第i+1个跳连块Di+1的输入端连接,并经过第i+1个跳连块Di+1中的多个直连块后,与第i+2个跳连块Di+2的输入端连接,同时,第i个跳连块Di的输出端跳过第i+1个跳连块Di+1直接与第i+2个跳连块Di+2的输入端连接;
所述第n张遥感图像Tn经过所述特征提取网络f的处理后,由直连块d的I个跳连块D分别输出不同尺度的特征图Fn={Fn,i|i=1,2,…,I,I+1},其中,Fn,1表示直连块d输出的特征图,Fn,i,i=2,3,…I,表示第i-1个跳连块Di输出的特征图;
步骤2.2、所述多尺度上下文增强网络g,用于获取第n张遥感图像Tn的上下文特征;
步骤2.2.1、将第i个特征图Fn,i输入到所述多尺度上下文增强网络g中,首先通过切割处理得到m+1组特征其中,表示第i个特征图Fn,i的第0组特征,C0为的通道数,为第i个特征图Fn,i的第j+1组特征,Cj为的通道数,且H为特征图的长度,W为特征图的宽度,C为输入特征图Fn,i的通道数;
步骤2.2.2、所述多尺度上下文增强网络g利用式(1)构建级联递归卷积对特征和进行处理,得到第i个特征图Fn,i的第j+1阶特征
式(1)中,Dw为深度可分离卷积操作,⊙为矩阵相乘操作,矩阵相加操作,Ch为通道变换操作;表示第i个特征图Fn,i的第j阶特征;
步骤2.2.3、所述多尺度上下文增强网络g利用式(2)得到第i个特征图Fn,i的多尺度增强特征Gn,i,从而得到第I+1个特征图Fn,I+1的多尺度增强特征Gn,I+1;
式(2)中,CA表示通道注意力机制,为第i个特征图Fn,i的第m阶特征;
步骤2.3、所述空间金字塔通道增强网络e利用子像素卷积以及自适应采样因子对所述多尺度增强特征Gn,i进行通道增强和高效融合;
步骤2.3.1、空间金字塔通道增强网络e对Gn,i进行子像素卷积处理后,得到尺度放大z倍,通道数缩减1/z2的特征图,再对特征图进行通道变换后,与第i-1个特征图Fn,i-1的多尺度增强特征Gn,i-1进行融合后,得到新的多尺度增强特征G′n,i-1;
步骤2.3.2、利用式(3)构建α和β的约束条件,将Gn,i进行α倍上采样,将Gn′,i-1进行β倍下采样,然后将两者的结果融合后得到G′n,i-1和G′n,i的中间层特征
式(3)中,α为上采样因子,β为下采样因子,获取特征图长度和宽度进行向下取整后的值;
步骤2.3.3、所述中间层特征进行α倍上采样后,与G′n,i-1进行融合,得到第i-1个遥感目标检测网络输出特征Pn,i-1;
步骤2.3.4、按照步骤2.3.1-2.3.2的过程,对第I+1个特征图Fn,I+1的多尺度增强特征Gn,I+1进行卷积处理后,与第I个中间层特征进行β倍下采样后的结果融合,从而得到第I+1个特征图Fn,I+1的遥感目标检测网络输出特征Pn,I+1;
步骤3、构建检测头模块u,包括权值共享的基于卷积操作的两个分支预测器;
步骤3.1、对Gn,I+1进行卷积变换后,得到第I+2个遥感目标检测网络输出特征Pn,I+2,对Pn,I+2进行通道自适应下采样后,得到第I+3个遥感目标检测网络输出特征Pn,I+3;
步骤3.2、所述检测头模块中的两个分支预测器分别对Pn,i-1,Pn,I+1,Pn,I+2,Pn,I+3进行处理,其中一个分支预测器输出每个遥感图像中的各个目标预测框所属类别,另一个分支预测器输出每个图像中的的各个目标预测框的位置信息;
步骤3.3、根据检测头模块的输出结果与遥感图像的目标真实框,计算Focal loss分类损失和smoothL1回归损失,从而利用梯度下降法对所述遥感图像目标检测网络进行反向传播以更新网络参数,直到损失收敛位置,从而得到最优遥感图像目标检测模型,用于实现对遥感图像的分类和识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310314455.X/1.html,转载请声明来源钻瓜专利网。