[发明专利]基于单阶段全卷积网络和多特征融合的遥感目标检测方法有效
申请号: | 202110442872.3 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113177456B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 白静;温征;唐晓川;董泽委;郭亚泽;裴晓龙;闫逊;孙放;张秀华 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/80;G06V10/77;G06V10/774;G06V10/82;G06N3/08;G06T5/30;G06T7/13 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 阶段 卷积 网络 特征 融合 遥感 目标 检测 方法 | ||
1.一种基于单阶段全卷积网络和多特征融合的遥感目标检测方法,其特征在于,包括如下:
(1)分别提取光学遥感图像的数学形态学特征、线性尺度空间特征、非线性尺度空间特征:
1a)在原始图像上分别进行开运算和闭运算,得到2n个初始特征图,再对所有的初始特征图进行逐像素相加并取平均值,得到原始图像的数学形态学特征图,其中,n表示开运算或闭运算的次数;
1b)分别使用高斯滤波器和Sobel边缘提取算子对原始图像进行滤波,得到一张三通道高斯模糊的特征图和四张单通道局部边缘特征图;将这四张单通道局部边缘特征图进行逐像素求和并取平均,得到整体边缘特征图;将这一张三通道高斯模糊的特征图的每个通道分量,分别与该整体边缘特征图进行逐像素融合,得到线性多尺度空间特征图;
1c)将原始的光学遥感图像先转化为单通道灰度图,再使用二维单级小波变换函数对其进行小波分解,得到低频分量图、水平高频分量图、垂直高频分量图和对角高频分量图这四张单通道子图;抛弃其中的低频分量子图,将其它三张高频分量子图进行通道拼接,得到非线性多尺度空间特征图;
(2)构造融合特征图:
2a)将数学形态学特征图、线性多尺度空间特征图按照α,β的比例进行逐像素融合,得到初始融合图像,其中α,β满足α+β=0.5;
2b)将原始图像乘以比例系数0.5后与初始融合图像进行逐像素求和,再与非线性多尺度空间特征图进行逐像素相加,得到最终的特征融合图像;
(3)数据集划分和小目标扩充:
3a)对于所有光学遥感图像,根据标注信息计算所有待检测目标中面积最大值和最小值,标记为Smax和Smin并设置阈值
3b)将所有光学遥感图像随机按照8:2的比例划分为训练数据集和测试数据集;
3c)对于训练集中的每一张原始图像,遍历该原始图像中的所有待检测目标,如果该目标面积Si小于阈值S,则先在原始图像中选择一块无目标位置,再将该目标所在的最小方形区域复制到选择好的位置上,得到新的训练图像;否则对原始图像不做变化;遍历完成后,得到新的训练数据集;
所述在原始图像中选择一块无目标位置,实现如下:
3c1)在原始图像中随机选择位置(x,y),计算新位置的标注框信息[x,y,x+wi,y+hi],其中x+wi,y+hi分别表示新目标框的宽和高;
3c2)判断新位置与当前图像中已有的标注框是否重合,若不重合,则选该位置进行后续操作,否则,返回3c1);
3c3)当选择成功或者3c1)中随机选择位置重复达到100次,结束本次位置选择;
(4)使用基于深度学习的目标检测网络进行训练和检测:
4a)将测试数据集和新的训练数据集分别按照(1)和(2)的操作进行特征提取和融合,得到特征融合后的训练数据集和测试数据集;
4b)用特征融合后的训练数据集,通过梯度下降算法对现有的单阶段全卷积目标检测网络进行训练,直至网络的整体损失不再变化时停止,得到训练好的目标检测网络;
4c)将测试数据集输入到训练好的目标检测网络中,得到光学遥感图像的目标检测结果。
2.根据权利要求1所述的方法,其中1a)在原始图像上分别进行开运算和闭运算,分别使用大小为3×3和5×5的卷积核,对原始光学遥感图像进行先膨胀后腐蚀操作和先腐蚀后膨胀操作,得到两张开运算特征图和两张闭运算特征图。
3.根据权利要求1所述的方法,其中1b)中使用Sobel边缘提取算子对原始图像进行滤波,是使用四个3×3大小的卷积核分别与原始图像进行卷积,得到四张局部边缘特征图,其中四个卷积核的方向分别为:0°,45°,90°,135°。
4.根据权利要求1所述的方法,其中4b)中所述通过梯度下降算法对现有的单阶段全卷积目标检测网络进行训练,实现如下:
4b1)删除单阶段全卷积目标检测网络中FPN的最顶部特征层P7,保留P3,P4,P5,P6特征层;
4b2)将训练数据送入网络中进行前向传播,并在4b1)中保留的P3,P4,P5,P6特征层上进行目标框回归,得到目标预测结果,这四个特征层中预测目标的大小范围为:0,64,128,256,∞;
4b3)计算4b2)得到的预测结果与真实标签之间的整体损失,然后进行反向传播,更新网络参数;
4b4)重复4b2)-4b3),直至网络收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110442872.3/1.html,转载请声明来源钻瓜专利网。