[发明专利]基于位置感知的高分辨遥感图像倾斜船舶目标检测方法有效
申请号: | 202010708200.8 | 申请日: | 2020-07-21 |
公开(公告)号: | CN111860336B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 李映;刘凌毅 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V10/24;G06V10/40;G06V10/762;G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 位置 感知 分辨 遥感 图像 倾斜 船舶 目标 检测 方法 | ||
1.一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法,其特征在于步骤如下:
步骤1:图像预处理:将遥感图像处理成统一地物分辨率和尺寸的图像块,并进行归一化;
步骤2:将预处理后的图像块输入训练好的UNet-like多尺度卷积网络进行特征提取,得到不同尺寸的特征图;所述的UNet-like多尺度卷积网络由主干网络和特征融合网络构成,主干网络选用ResNet101,用于提取4种不同深度水平的特征图{C2,C3,C4,C5};特征融合网络利用双线性插值将深层特征图C5放大为原来的2倍,使其与浅层特征图C4融合,再通过一个3x3卷积层和一个1x1卷积层得到融合后的特征图C4’,将C4’放大为原来的2倍与C3融合,得到特征图C3’,将C3’放大为原来的2倍与C2融合,得到特征图C2’;最后将特征图{C2’,C3’,C4’}分别传入一个3x3卷积层和一个1x1卷积层,得到融合后的特征图{P2,P3,P4},其具有相同的通道数但不同的特征图尺寸,尺寸最大的P2用于检测小目标船舶,尺寸最小的P4用于检测大目标船舶;
步骤3:基于anchor的倾斜边框回归模型
基于锚点的倾斜边框回归模型从步骤2得到的三个不同尺寸的特征图中直接进行预测,回归模型可分为分类子网络和位置回归子网络两部分,分类子网络预测每个锚点的概率得分,位置回归子网络预测锚点到预测框四边的距离和倾斜角度,其步骤如下:
(1)从数据集内采集船舶尺寸信息,将其按照面积划分为3组,每组利用K-mean算法得到5个聚类作为anchor先验参数;
(2)分类子网络按顺序由三个3x3卷积层,一个1x1卷积层和一个sigmoid函数构成,分类子网络输出得分图与输入特征图尺寸相同,通道数为5,代表5个anchor存在船舶目标的概率的得分,从得分图内筛选出高于阈值的点作为预测点;
(3)回归子网络结构与分类子网络一致,输出特征图的通道数为25,代表5个anchor的距离和角度预测量(t1,t2,t3,t4,tθ),预测框的距离和角度由预测量和anchor先验参数计算,其公式如下:
θ=(sigmoid(tθ×2-1)×π/4
其中hk和wk是第k个anchor的长宽先验参数;
(4)将提取出来的特征图{P2,P3,P4}分别输入训练好的基于锚点的倾斜边框回归模型,得到分类得分图,距离预测图和角度预测图,筛选出得分图中大于0.5的锚点位置(x,y),并提取该锚点位置的距离预测值(t1,t2,t3,t4)和角度预测值tθ,根据步骤(3)中公式计算出预测距离(d1,d2,d3,d4)和倾斜角度θ;
(5)预测框位置由锚点坐标(x,y)和预测的距离(d1,d2,d3,d4)及倾斜角度θ唯一确定,{D1,D2,D3,D4}为预测框的点,D1点为x,y坐标和最小的点,D2,D3,D4顺时针依次排列,d1,d2,d3,d4为锚点到四条边的距离,θ为预测框的倾斜角;
步骤4:位置感知得分校准
位置感知得分校准模型对预测框得分进行修正,根据预测框的位置选取9个采样点,将采样点在得分图上的采样值的均值作为预测框的修正得分,其具体步骤如下:
(1)根据预测框的坐标位置,计算采样点的坐标位置:
其中(x1,y1),(x2,y2),(x3,y3),(x4,y4)分别为倾斜框端点D1,D2,D3,D4的坐标;
(2)将采样点从原图映射到得分图上,利用双线性插值得到采样点位置的预测得分值,并取采样点的得分值均值作为预测框的校正得分值;
(3)利用非极大值抑制算法将重叠度大于0.3的冗余预测框去除,得到图像块的检测结果;
步骤5:图像块检测结果融合
借助图像块信息将预测框在图像块的坐标转化为原图上的坐标,并利用非极大值抑制算法剔出冗余预测框,得到最终检测结果,其步骤如下:
(1)将预测框的坐标与所在图像块的左上角坐标相加并按照图像块的放缩比例还原,得到预测框在原检测遥感图像上的坐标位置;
(2)将所有图像块上的结果汇总,利用非极大值抑制算法剔出重叠度大于0.3的候选框,得到最终检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010708200.8/1.html,转载请声明来源钻瓜专利网。