[发明专利]基于像素分类的光学遥感图像多目标检测方法有效
申请号: | 201911366599.X | 申请日: | 2019-12-26 |
公开(公告)号: | CN111191566B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 李映;张谷雨;刘凌毅;李西萍 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/80;G06V10/82;G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 像素 分类 光学 遥感 图像 多目标 检测 方法 | ||
1.一种基于像素分类的光学遥感图像多目标检测方法,其特征在于步骤如下:
步骤1:对输入的光学遥感图像进行归一化操作,使得数据分布符合标准正态分布,然后将图像随机剪裁、缩放到同一尺寸;
步骤2:构建网络模型,所述的网络模型包括特征提取层、特征融合层、预测层,特征提取层使用残差网络结构,并且加入了空洞卷积;特征融合层使用了ASPP网络,获得了不同感受野的特征,再结合通道注意力机制对不同通道的特征分配权重,之后对特征图进行上采样并将不同层的特征合并;预测层通过四组1*1的卷积核同时得到不同作用的特征图,分别为类别预测、目标框长宽预测、中心点偏移量预测以及旋转角度预测;
步骤3:根据标注的光学遥感图像数据集,计算每个像素点的真实值Yxyc、目标框的宽高(w,h)、图像下采样到1/4之后中心点的偏移量目标框的旋转角度θ;
所述的Yxyc的计算式:
其中,x,y表示图像任意坐标,p表示原图中某个目标中心点的坐标;表示下采样后的坐标σp是一个与目标大小相关的标准差;
所述的目标框的宽高(w,h)由数据标注文件直接读出;
所述的图像下采样到1/4之后中心点的偏移量包括横向的偏移和纵向的偏移;
所述的目标框的旋转角度θ的计算过程:定义目标框的四个顶点分别是a,b,c,d,顺时针方向标记;首先找到纵坐标最大的一个点作为基准点,定为a点;之后,选择a点相邻的右边的顶点d,计算出这两个点之间边与纵轴构成的夹角θ;
步骤4:对于步骤2中特征提取部分使用在ImageNet数据集上预训练过的残差网络参数初始化,而特征融合部分以及预测部分的参数使用随机初始化的方式;
步骤5:每次在光学遥感图像训练集中随机选取图片作为网络输入,将网络得到的输出结果以及通过人工标注的目标框计算得到的真值计算类别损失、目标大小损失、中心点偏移量损失和旋转角度的损失,通过Adam优化算法来对整个网络的参数进行更新;
所述的类别损失函数:
其中,表示坐标(x,y)这一像素点是C类的某个物体的中心点的预测的概率得分,Yxyc是这一点从标注中计算出真实的概率;
所述的目标大小损失函数:
其中,和分别代表预测框的长和宽,hk和wk分别代表真实的长和宽,k代表预测的第k个目标的中心,N代表中心点数量;其中α和β是超参数;
所述的中心点偏移量损失函数:
其中,p表示原始坐标,表示下采样后的坐标;表示预测的偏移量,共2维,表示横向和纵向的偏移量;
所述的旋转角度的损失函数:
其中,是模型预测的角度,θ是真实的角度;
整体损失函数为类别损失函数、目标大小损失函数、中心点偏移量损失函数与旋转角度损失函数的和;
Ldet=Lc+λsizeLsize+λoffLoff+λangleLangle
其中,λsize、λoff、λangle分别为目标大小损失函数、中心点偏移量损失函数与旋转角度损失函数的权重;
步骤6:重复步骤5,使用Adam优化算法不断的对网络参数进行更新,直到步骤5中整体损失函数收敛;
步骤7:把测试集的图片作为网络的输入,利用网络得到的每个像素点是否是中心的概率,目标框大小和旋转角度对目标框进行预测,具体而言,如果某点是某个类别中心点的概率大于设定的阈值,则根据该点预测的目标大小、中心偏移以及旋转角度得到目标框。
2.根据权利要求1所述的一种基于像素分类的光学遥感图像多目标检测方法,其特征在于所述的步骤7的设定的阈值取0.3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911366599.X/1.html,转载请声明来源钻瓜专利网。