[发明专利]一种基于双编码器网络模型的遥感影像道路提取方法在审
申请号: | 202211508237.1 | 申请日: | 2022-11-29 |
公开(公告)号: | CN115731468A | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 何明祥;徐金硕;李冠 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/77;G06V10/82;G06N3/08;G06N3/0464 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 王鸣鹤 |
地址: | 266590 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码器 网络 模型 遥感 影像 道路 提取 方法 | ||
1.一种基于双编码器网络模型的遥感影像道路提取方法,其特征在于,包括以下步骤:
步骤1:对数据集中的遥感图像进行图像增强,将的遥感图像进行随机饱和度值、色相变换和平移、旋转处理;
步骤2:构建道路提取网络模型;
步骤2.1:搭建Swin-T编码器;
步骤2.2:搭建ResNet编码器;
步骤2.3:搭建空洞卷积块;
步骤2.4:搭建解码器;
步骤2.5:搭建道路析出块,获得灰度图像;
步骤3:模型训练,把遥感图像数据输入训练模型当中进行训练。
2.根据权利要求1所述的一种基于双编码器网络模型的遥感影像道路提取方法,其特征在于,步骤2的具体步骤包括:
步骤2.1:Swin-T编码器以Swin Transformer为基本框架,Swin-T编码器为:首先是序列映射块,然后按顺序连接四个段;四个段分别是2层Swin Transformer为一段,2层SwinTransformer为一段,6层Swin Transformer为一段,2层Swin Transformer为一段,每两个段之间有一个序列融合块;
步骤2.1.1:所述序列映射块的构建步骤:进行一次卷积,使输出通道为96,卷积核大小为4,步长为4,使像素点映射到一个个序列上;连接一个Layer Norm层;
步骤2.1.2:所述序列融合块的构建步骤:先连接一个Layer Norm层;使用一次空洞卷积使特征图数量加倍,大小缩小
步骤2.2:ResNet编码器以ResNet34为基本框架,ResNet编码器为:首先是一次适应卷积、一次Batch Norm、一次ReLU激活函数,使图片规范为512×512×64,然后进行一次下采样,最后接续四段,接续四段分别是ResNet34的layer1、layer2、layer3和layer4;
步骤2.3:Swin-T编码器后构建并连接空洞卷积块;所述空洞卷积块构建步骤如下:
步骤2.3.1:连接一个Layer Norm层;
步骤2.3.2:连接n个空洞卷积层:
Conv2d(kernel_size=3,dilation=1,padding=1)
Conv2d(kernel_size=3,dilation=2,padding=2)
……
Conv2d(kernel_size=3,dilation=2n-1,padding=2n-1)
Conv2d()为卷积函数,kernel_size为卷积核大小,dilation为膨胀因子,n层的膨胀因子分别1、21,...,2n-1,padding为卷积填充,n层的卷积填充分别为1、21,...,2n-1,其中size为特征图大小;
步骤2.3.3:每层空洞卷积层后跟ReLU激活函数;
步骤2.3.4:空洞卷积块各层输出相加,得到此块最后的输出;
步骤2.4:空洞卷积块后构建并连接解码器,解码器由五段组成,若特征图尺寸提前达到则可提前跳出解码器;然后ResNet编码器各layer的输出与解码器各个段相同尺寸的特征图跳跃拼接;所述跳跃拼接具体为,由ResNet编码器各层输出的特征图,与解码器各段输出的相同尺寸的特征图进行跳跃拼接,拼接后的特征图输入到解码器的下一个段;
所述解码器的搭建步骤如下:
步骤2.4.1:先连接一个卷积核大小为1的卷积层,然后经Batch Norm和ReLU激活函数处理;
步骤2.4.2:再连接一个转置卷积:
ConvTranspose2d(kernel_size=3,stride=2,padding=1,output_padding=1)
ConvTranspose2d()为转置卷积函数,转置卷积核大小为3,stride为步长,卷积填充为1,输出特征图填充为1,然后经Batch Norm和ReLU激活函数处理;
步骤2.4.3:最后连接一个卷积核大小为1的卷积层,然后经Batch Norm和ReLU激活函数处理;
步骤2.4.4:将步骤2.4.1至步骤2.4.3封装为一段,按此流程循环构建五段;
步骤2.5:解码器后构建并连接道路析出块,道路析出块的构建包括:
步骤2.5.1:连接一个转置卷积层,然后经Batch Norm和ReLU激活函数处理,使特征图大小变为原图像大小;
步骤2.5.2:连接三个卷积核大小为3,卷积填充为1,步长为1的卷积层,使特征图数量降为1,每两个特征图之间进行ReLU激活函数处理;
步骤2.5.3:连接一个Sigmoid激活函数,得到与输入图像大小相同、单通道的结果图像。
3.根据权利要求1所述的一种基于双编码器网络模型的遥感影像道路提取方法,其特征在于,所述训练模型训练时,初始学习率为2e-4,若连续三轮以上损失值不下降,则学习率衰减5倍,连续六轮损失值不下降,则默认训练完成,单卡RTX3060训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211508237.1/1.html,转载请声明来源钻瓜专利网。