[发明专利]基于多尺度特征整合和注意力机制的旋转目标检测方法在审
申请号: | 202010374248.X | 申请日: | 2020-05-06 |
公开(公告)号: | CN111539428A | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 黎万义;李文通;王鹏;罗永康 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 特征 整合 注意力 机制 旋转 目标 检测 方法 | ||
1.一种基于多尺度特征整合和注意力机制的旋转目标检测方法,其特征在于,该方法包括:
步骤S100,获取待检测的图像,作为输入图像;
步骤S200,采用特征金字塔网络提取所述输入图像的多尺度特征,并分别通过预设的特征卷积处理方法进行处理,得到处理特征图;采用双线性插值法对各处理特征图进行缩放并整合,得到整合多尺度的特征图I;
步骤S300,基于第一网络的双通道卷积层,分别通过所述预设的特征卷积处理方法对I进行处理,得到前景特征图、背景特征图,并与I进行矩阵逐点相乘运算,得到前景显著性特征图A1、背景显著性特征图A2;所述第一网络为基于注意力机制的卷积神经网络;
步骤S400,基于A1、A2,通过预设第一方法得到注意力特征图;基于所述注意力特征图,通过区域建议网络获取待检测目标的候选区域;
步骤S500,根据候选区域的位置,并结合所述注意力特征图,通过旋转目标检测网络得到所述待检测目标的检测结果;所述旋转目标检测网络基于卷积神经网络构建。
2.根据权利要求1所述的基于多尺度特征整合和注意力机制的旋转目标检测方法,其特征在于,步骤S200中“分别通过预设的特征卷积处理方法进行处理,得到处理特征图”,其方法为:
对多尺度特征进行多个设定尺寸的卷积,卷积后相加,并通过线性整流激活函数进行处理,得到处理特征图。
3.根据权利要求2所述的基于多尺度特征整合和注意力机制的旋转目标检测方法,其特征在于,各处理特征图其缩放的尺寸为其中,n为特征金字塔网络的层级数。
4.根据权利要求3所述的基于多尺度特征整合和注意力机制的旋转目标检测方法,其特征在于,所述整合多尺度的特征图I其获取方法为:
其中,Fk为经过缩放后的处理特征图,k为自然数,表示下标。
5.根据权利要求1所述的基于多尺度特征整合和注意力机制的旋转目标检测方法,其特征在于,所述第一网络的双通道卷积层其在训练过程中的更新方法为:
基于获取的前景特征图、背景特征图,结合预设的掩膜Mask,通过LAtt损失函数获取损失值;
基于所述损失值,对双通道卷积层的权重参数进行更新。
6.根据权利要求1所述的基于多尺度特征整合和注意力机制的旋转目标检测方法,其特征在于,步骤S400中“通过预设第一方法得到注意力特征图”,其方法为:
A=max(A1-A2,0)
其中,A表示注意力特征图。
7.根据权利要求1所述的基于多尺度特征整合和注意力机制的旋转目标检测方法,其特征在于,所述旋转目标检测网络其结构包括池化层、全连接层、分类层、回归层;其中,所述全连接层其层数为2;所述池化层的池化方式为PS ROI Align;通过该网络获取检测结果的方法为:
基于候选区域的位置,通过PS ROI Align的池化方式将所述注意力特征图对应区域进行池化,得到固定尺寸的区域特征图;
通过全连接层提取各区域特征图的特征,并通过所述分类层对待检测目标进行分类;
基于分类结果,通过所述回归层对待检测目标的区域进行坐标回归,得到坐标回归值;
通过坐标合并方法、非极大值抑制方法对各坐标回归值进行处理,得到待检测目标的检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010374248.X/1.html,转载请声明来源钻瓜专利网。