[发明专利]用于遥感目标检测的旋转目标检测方法有效
申请号: | 202110666805.X | 申请日: | 2021-06-16 |
公开(公告)号: | CN113284185B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 张军;黄若飞;李妍;石陆魁;张洋;李思敏;刘月;吴朋莉 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06N3/04;G06N3/08;G06K9/62;G06V10/764 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 蔡运红 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 遥感 目标 检测 旋转 方法 | ||
1.一种用于遥感目标检测的旋转目标检测方法,其特征在于,该方法包括如下步骤:
第一步、获取遥感图像,得到遥感图像中目标外接矩形的位置信息(x,y,w,h),并对遥感图像进行归一化处理;
第二步、利用深度学习网络进行目标检测,输出预测结果,预测结果为目标的类别和位置信息(x,y,w,h,r,sign);令旋转目标对应的矩形EFGH的四个顶点分别位于目标外接矩形ABCD的边AD、AB、BC和CD上,则r表示线段AF与边AB之比,r∈(0,1);sign表示线段ED的长度,若线段ED的长度大于h/2,则sign的预测值为1;若线段ED的长度小于h/2,则sign的预测值为0;
第三步、对预测结果进行解码,根据目标外接矩形的位置信息得到旋转目标;
目标外接矩形ABCD的边AB的长度为w,边BC的长度为h;令边AF的长度为a,a=wr,则边FB的长度为w-a;线段BG的长度为X,则线段AE的长度为h-X;
根据三角形AEF与三角形BFG相似,得FB/AE=BG/AF,有式(8):
式(8)经过变形得到式(9):
当sign的预测值为1时,sign的预测值为0时,
已知目标外接矩形ABCD中心点的坐标(x,y),得到A点坐标(x-w/2,y-h/2),B点坐标(x+w/2,y-h/2),C点坐标(x+w/2,y+h/2),D点坐标(x-w/2,y+h/2),F点坐标(x-w/2+a,y-h/2),G点坐标(x+w/2,y-h/2+X),H点坐标(x+w/2-a,y+h/2),E点坐标((x-w/2,y+h/2-X),矩形EFGH即为旋转目标。
2.根据权利要求1所述的用于遥感目标检测的旋转目标检测方法,其特征在于,在深度学习网络训练过程中,采用式(5)计算分类损失:
Lcls(p,u)=-log pu (5)
式(5)中,p为预测框通过softmax函数计算得到的分类概率,u表示预测框对应目标的真实类别标签;
利用式(6)计算回归损失;
式(6)中,ti=[tx,ty,tw,th,tr],tx=(x-xa)/wa,ty=(y-ya)/ha,tw=log(w/wa),th=log(h/ha),tr=log(r/wa),x,xa,x*分别表示预测框、锚框和真实框的横坐标,wa表示锚框的宽度,y,w,h,r同理;
利用式(7)计算sign损失:
Lsign(s,s*)=-[s*log(s)+(1-s*)log(1-s)] (7)
其中,s为将候选框预测为真实框的概率,s*为真实标签。
3.根据权利要求1所述的用于遥感目标检测的旋转目标检测方法,其特征在于,第一步中,利用遥感图像中旋转目标的OBB标注得到目标外接矩形的位置信息,目标外接矩形的长和宽分别与遥感图像的长和宽平行。
4.根据权利要求1所述的用于遥感目标检测的旋转目标检测方法,其特征在于,深度学习网络以ResNet101网络作为主干网络,利用ResNet101网络对归一化后的遥感图像进行特征提取;将ResNet101网络最后三层的输出结果输入到FPN中进行特征融合,FPN输出三个不同尺度大小的特征图;将三个特征图分别输入到RPN网络中生成候选框,将FPN输出的特征图和该特征图对应的候选框输入到RoI Pooling层,根据候选框从特征图上生成特征向量;将特征向量经过两个并行的全连接层进行分类预测和回归预测,得到分类信息和位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110666805.X/1.html,转载请声明来源钻瓜专利网。