[发明专利]一种基于改进U-Net模型的遥感建筑物影像提取方法有效
申请号: | 202310154107.0 | 申请日: | 2023-02-23 |
公开(公告)号: | CN115841625B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 邵艳利;黎鑫;王兴起;魏丹;陈滨;方景龙 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/20;G06V10/82;G06V10/80;G06V10/44;G06N3/0464;G06N3/09 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 net 模型 遥感 建筑物 影像 提取 方法 | ||
1.一种基于改进U-Net模型的遥感建筑物影像提取方法,其特征在于:具体步骤如下:
步骤1、对原始的遥感建筑物图像进行预处理;
步骤2、构建一个U-Net模型,然后在跳跃连接部分加入协调注意力门控模块,对每一层卷积编码结果进行门控激活;接着在U-Net模型的桥接部分添加高效连续金字塔模块,对编码器的输出进行分组特征提取,提取结果传入解码器;最后在解码器部分引入双向联级监督结构,生成边缘特征图,并将边缘特征图的融合结果作为改进U-Net模型的输出预测图;
步骤3、将双向联级监督结构得到的边缘特征图和模型输出预测图作为监督依据,对改进U-Net模型进行优化训练;将步骤1处理后的图像输入训练后的改进U-Net模型完成遥感建筑物影像提取;
所述高效连续金字塔模块对输入特征进行点积压缩、组内特征逐级融合和组间特征融合,具体步骤如下:
步骤2-2-1、将模块输入分为三个不同分组,在每个分组内均通过逐点卷积压缩空间特征;
步骤2-2-2、在每个分组内将压缩后的特征送入三个并联的空洞卷积分支中,然后按照膨胀率从低到高的顺序,逐级叠加三个空洞卷积分支提取到的特征信息,再对叠加的结果进行融合,完成组内层次特征融合;
步骤2-2-3、将三个分组输出的特征进行组间相加融合,得到高效连续金字塔模块的输出特征;
双向联级监督结构在解码器每层的上采样操作之前添加两条支路,在支路内进行大小为1x1、步长为1的卷积操作和不同倍数的上采样操作,从而得到与输入图像大小相等的中间特征图;然后再分别按照特征由浅到深和由深到浅的顺序,对两条支路得到的中间特征图进行逐级融合,获得8张边缘特征图:
其中,s=1,2,3,4,表示由浅到深融合过程中第s层所得的边缘特征图,表示由深到浅融合过程中第s层所得的边缘特征图;最后将所有边缘特征图通过1×1卷积操作进行融合,得到改进U-Net模型的输出预测图。
2.如权利要求1所述一种基于改进U-Net模型的遥感建筑物影像提取方法,其特征在于:步骤1中对原始的遥感建筑物图像进行预处理的具体方法为:
步骤1-1、从左上角开始使用滑动窗口,按照从左到右、从上到下的顺序,将原始图像的分辨率统一裁剪到256×256,对于裁剪后分辨率小于256×256的图片进行扩展操作,并剔除不完整的图像;
步骤1-2、采用零均值归一化方法对步骤1-1得到的图像进行灰度归一化处理,将其灰度值统一在0到1之间:
其中,F(x,y)表示经过归一化处理后的图像,f(x,y)表示裁剪后的图像,mean(f(x,y))表示灰度平均值,std(f(x,y))表示方差。
3.如权利要求1所述一种基于改进U-Net模型的遥感建筑物影像提取方法,其特征在于:所述改进U-Net模型在编码阶段对输入图像进行3层卷积和下采样操作,每层卷积操作得到的特征图输入协调注意力门控模块进行门控激活;在解码阶段对高效连续金字塔模块的输出特征进行3层卷积和上采样操作,并在每次卷积操作前与协调注意力门控模块输出的同尺度特征图进行拼接。
4.如权利要求1或3所述一种基于改进U-Net模型的遥感建筑物影像提取方法,其特征在于:所述协调注意力门控模块对每一层卷积编码结果进行门控激活,包括协调池化、通道压缩和门控激活三个步骤:
步骤2-1-1、将编码器一层的卷积编码结果作为模块输入,分别在水平和垂直两个方向进行尺寸为(H,1)和(1,W)的全局池化操作,得到沿水平和垂直两个空间方向的聚合特征;其中H、W分别表示模块输入的高度、宽度;
步骤2-1-2、对步骤2-1-1得到的两个空间方向的聚合特征进行拼接,得到保存了两个不同方向上的空间上下文特征信息的特征图;再使用1×1卷积操作将其通道数缩小为原始通道数的1/32;
步骤2-1-3、针对通道数缩小后的特征图分别使用两个1×1卷积操作,生成横向注意力权重图和纵向注意力权重图,然后与模块输入进行点乘,转化为将要传入解码器部分的输出,完成协调注意力门控激活过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310154107.0/1.html,转载请声明来源钻瓜专利网。