[发明专利]基于多尺度特征整合和注意力机制的旋转目标检测方法在审
申请号: | 202010374248.X | 申请日: | 2020-05-06 |
公开(公告)号: | CN111539428A | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 黎万义;李文通;王鹏;罗永康 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 特征 整合 注意力 机制 旋转 目标 检测 方法 | ||
本发明属于计算机视觉领域,具体涉及一种基于多尺度特征整合和注意力机制的旋转目标检测方法、系统、装置,旨在解决旋转目标检测方法检测精度较低、鲁棒性差的问题。本系统方法包括:获取待检测的图像;采用特征金字塔网络提取图像的多尺度特征,并进行处理、缩放、整合,得到整合多尺度的特征图I;分别对I进行处理,得到前景特征图、背景特征图,并与I进行矩阵逐点相乘运算,得到前景显著性特征图、背景显著性特征图;通过预设第一方法得到注意力特征图,并通过区域建议网络获取待检测目标的候选区域;根据候选区域的位置,并结合注意力特征图,通过旋转目标检测网络得到检测结果。本发明提高了检测的精度及鲁棒性。
技术领域
本发明属于计算机视觉领域,具体涉及一种基于多尺度特征整合和注意力机制的旋转目标检测方法、系统、装置。
背景技术
目标检测是一项重要的计算机视觉任务,广泛应用于遥感、工业检测、机器人等领域。其中,在俯视角度等条件下的目标检测存在目标角度多样、分布密集复杂、尺度差异大、具有类内差异与类间相似性,背景复杂等问题。常规的目标检测为水平框,对于自然图像,目标多为垂直水平分布,然而对于从俯视角度获取的图像,目标会以任意角度的形式呈现,水平框往往不能满足此类目标的精确检测,尤其是对于长、宽比尺度相差较大且目标密集分布的情况,水平框检测框之间相互重叠且冗余的检测区域过多,且采用非极大值抑制(NMS)的过程,极容易出现目标漏检的情况。
目前基于深度学习的双阶段目标检测算法在检测精度上有很好的优势与性能表现,其中以Faster RCNN为代表的网络模型在自然图像上取得了令人满意的效果。然而该方法难以直接应用于俯视角度获取图像等条件下的旋转目标检测。在已有研究中,旋转框目标检测应用于场景文字检测任务较多,以R2CNN为代表的算法,在场景文字检测上取得优异的表现。然而,对于背景复杂的高分遥感、工业检测等图像,由于存在目标角度多样、分布密集复杂、尺度差异大、具有类内差异与类间相似性,背景复杂等难点,场景文字检测的旋转框目标检测算法无法有效地应用与解决此问题,这也使得俯视角度获取图像条件下的多类旋转目标检测更具有挑战性。
综上分析,研究能有效处理目标角度多样、分布密集复杂、尺度差异大等难点的旋转目标检测方法,显得尤为重要。因此,本发明提出了一种基于多尺度特征整合和注意力机制的旋转目标检测方法。
发明内容
为了解决现有技术中的上述问题,即为了解决现有的旋转目标检测方法对于俯视角度下目标角度多样、尺度差异大、背景复杂等情况下得检测精度较低、鲁棒性差的问题,本发明第一方面,提出了一种基于多尺度特征整合和注意力机制的旋转目标检测方法,该方法包括:
步骤S100,获取待检测的图像,作为输入图像;
步骤S200,采用特征金字塔网络提取所述输入图像的多尺度特征,并分别通过预设的特征卷积处理方法进行处理,得到处理特征图;采用双线性插值法对各处理特征图进行缩放并整合,得到整合多尺度的特征图I;
步骤S300,基于第一网络的双通道卷积层,分别通过所述预设的特征卷积处理方法对I进行处理,得到前景特征图、背景特征图,并与I进行矩阵逐点相乘运算,得到前景显著性特征图A1、背景显著性特征图A2;所述第一网络为基于注意力机制的卷积神经网络;
步骤S400,基于A1、A2,通过预设第一方法得到注意力特征图;基于所述注意力特征图,通过区域建议网络获取待检测目标的候选区域;
步骤S500,根据候选区域的位置,并结合所述注意力特征图,通过旋转目标检测网络得到所述待检测目标的检测结果;所述旋转目标检测网络基于卷积神经网络构建。
在一些优选的实施方式中,步骤S200中“分别通过预设的特征卷积处理方法进行处理,得到处理特征图”,其方法为:
对多尺度特征进行多个设定尺寸的卷积,卷积后相加,并通过线性整流激活函数进行处理,得到处理特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010374248.X/2.html,转载请声明来源钻瓜专利网。