[发明专利]融合自学习语义特征与设计特征的遥感影像目标提取方法有效
申请号: | 201910777761.0 | 申请日: | 2019-08-22 |
公开(公告)号: | CN110544260B | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 张丽丽;吴继森;高红民;王慧斌;陈哲 | 申请(专利权)人: | 河海大学 |
主分类号: | G06T7/136 | 分类号: | G06T7/136;G06T5/00;G06T7/181 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 孟红梅 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 自学习 语义 特征 设计 遥感 影像 目标 提取 方法 | ||
1.融合自学习语义特征与设计特征的遥感影像目标提取方法,其特征在于,包括如下步骤:
(1)使用人工设计的边缘算子确定遥感影像中的边缘点,查找遥感影像内部边缘线,依据边缘线完成影像分割并标记,不同分割对象采用不同奇数/偶数初始化其像素值,每个对象中所有像素初始化为同一奇数/偶数值;
(2)使用改进的Mask R-CNN模型自动学习并提取建筑物语义特征,并根据自学习语义特征提取出建筑物掩模图像,将掩模图像的像素值初始化为1;其中改进的Mask R-CNN模型将Mask R-CNN模型类别判断与位置拟合分支删除,将区域推荐网络中获取目标位置直接放入掩模图像获取分支;
(3)建立区域融合模型,将步骤(1)得到的对象分割图与步骤(2)得到的建筑物掩模图像对应像素相加,基于相加结果图中的奇数和偶数标记获取掩模图像占据每个分割对象比例,根据设定的阈值判断分割对象是否属于建筑物,对建筑物掩模图像进行优化,提取出建筑物目标。
2.根据权利要求1所述的融合自学习语义特征与设计特征的遥感影像目标提取方法,其特征在于,所述步骤(1)包括:
(11)以遥感影像作为数据源,使用高斯模板对遥感影像消除图像噪声;
(12)使用人工设计的边缘点提取算子获得遥感影像梯度图,根据边缘算子矩阵求出图像一阶梯度图,确定每个像素点的边缘梯度强度M和边缘方向θ:
θ=arctan(ty/tx)
上式中tx、ty为像素点(x,y)处水平、垂直方向的一阶导数值;
(13)依据检测边缘点在局部实现边缘点的连接,从而形成平滑边缘;具体为:通过设定边缘梯度强度阈值选取出图像边缘点位置,再在每个边缘点(x,y)处的一个邻域内依据规则判断其周围点是否为边缘点,具体判断规则如下:
|M(s,t)-M(x,y)|≤E
|θ(s,t)-θ(x,y)|≤A
其中(x,y)为提取到的边缘点,M(s,t)、M(x,y)分别为点(s,t)与点(x,y)处的梯度强度,θ(s,t)、θ(x,y)分别为点(s,t)与点(x,y)处的方向;E是一个正阈值;A为一个正角度阈值;当满足以上条件,坐标(s,t)的像素点被判定为与点(x,y)相连的边缘点;
(14)以生成的图像边缘线为基础,将图像划分为多个对象,并对每个对象标记,每个对象中所有像素使用同一奇数/偶数作为像素值进行标记。
3.根据权利要求1所述的融合自学习语义特征与设计特征的遥感影像目标提取方法,其特征在于,所述步骤(2)包括:
(21)通过改进的Mask R-CNN深度卷积网络确定自学习语义特征提取网络模型结构;网络具体设计结构为:使用50层残差卷积网络作为主干网络提取自学习语义特征,三个卷积层构成区域推荐网络用于输出待提取建筑物的位置信息,最后通过五层卷积层与一层反卷积层构成输出结构,输出结果为与原图大小相同的建筑物掩模图像;
(22)输入建筑物像素级标注数据集,经过反向传播算法迭代,训练网络参数,并基于训练后的改进的Mask R-CNN网络得到建筑物掩模图像。
4.根据权利要求3所述的融合自学习语义特征与设计特征的遥感影像目标提取方法,其特征在于,改进的Mask R-CNN网络的损失函数为:
Lmask=z*-log(sigmoid(x))+(1-z)*-log(1-sigmoid(x))
其中Lmask为二值交叉熵损失函数,z为标注真值,x为预测值,sigmoid为激活函数。
5.根据权利要求1所述的融合自学习语义特征与设计特征的遥感影像目标提取方法,其特征在于,所述步骤(3)包括:
(31)对于步骤(1)中获取的遥感影像分割对象进行每个对象所包含像素数量的统计,得到每个分割对象所占区域范围;然后统计神经网络模型提取得到的遥感影像中的建筑物掩模图像在每个对象中包含的像素数量;通过获取掩模图像占据每个分割对象比例,从而判断分割对象是否归属于建筑物;
(32)建立包含阈值λ的判断函数,当掩模图像所占据对象的像素数量大于或等于阈值时,此对象被标记为建筑对象;
判断函数公式如下所示:
γ(xi,yi)=sign(xi-λyi)
其中γ为建筑物标记,取值为0、1或-1,γ为1或0,则步骤(1)中分割对象i标记为建筑物,γ为-1,对象i标记为非建筑物;xi为建筑物掩模占据对象i的像素数,yi为对象i的像素数,λ为建筑物判别阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910777761.0/1.html,转载请声明来源钻瓜专利网。