[发明专利]一种基于双编码器网络模型的遥感影像道路提取方法在审

申请号：	202211508237.1	申请日：	2022-11-29
公开（公告）号：	CN115731468A	公开（公告）日：	2023-03-03
发明（设计）人：	何明祥;徐金硕;李冠	申请（专利权）人：	山东科技大学
主分类号：	G06V20/10	分类号：	G06V20/10;G06V10/77;G06V10/82;G06N3/08;G06N3/0464
代理公司：	青岛智地领创专利代理有限公司 37252	代理人：	王鸣鹤
地址：	266590 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于编码器网络模型遥感影像道路提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于双编码器网络模型的遥感影像道路提取方法，其特征在于，包括以下步骤：

步骤1：对数据集中的遥感图像进行图像增强，将的遥感图像进行随机饱和度值、色相变换和平移、旋转处理；

步骤2：构建道路提取网络模型；

步骤2.1：搭建Swin-T编码器；

步骤2.2：搭建ResNet编码器；

步骤2.3：搭建空洞卷积块；

步骤2.4：搭建解码器；

步骤2.5：搭建道路析出块，获得灰度图像；

步骤3：模型训练，把遥感图像数据输入训练模型当中进行训练。

2.根据权利要求1所述的一种基于双编码器网络模型的遥感影像道路提取方法，其特征在于，步骤2的具体步骤包括：

步骤2.1：Swin-T编码器以Swin Transformer为基本框架，Swin-T编码器为：首先是序列映射块，然后按顺序连接四个段；四个段分别是2层Swin Transformer为一段，2层SwinTransformer为一段，6层Swin Transformer为一段，2层Swin Transformer为一段，每两个段之间有一个序列融合块；

步骤2.1.1：所述序列映射块的构建步骤：进行一次卷积，使输出通道为96，卷积核大小为4，步长为4，使像素点映射到一个个序列上；连接一个Layer Norm层；

步骤2.1.2：所述序列融合块的构建步骤：先连接一个Layer Norm层；使用一次空洞卷积使特征图数量加倍，大小缩小

步骤2.2：ResNet编码器以ResNet34为基本框架，ResNet编码器为：首先是一次适应卷积、一次Batch Norm、一次ReLU激活函数，使图片规范为512×512×64，然后进行一次下采样，最后接续四段，接续四段分别是ResNet34的layer1、layer2、layer3和layer4；

步骤2.3：Swin-T编码器后构建并连接空洞卷积块；所述空洞卷积块构建步骤如下：

步骤2.3.1：连接一个Layer Norm层；

步骤2.3.2：连接n个空洞卷积层：

Conv2d(kernel_size＝3,dilation＝1,padding＝1)

Conv2d(kernel_size＝3,dilation＝2,padding＝2)

……

Conv2d(kernel_size＝3,dilation＝2^n-1,padding＝2^n-1)

Conv2d()为卷积函数，kernel_size为卷积核大小，dilation为膨胀因子，n层的膨胀因子分别1、2¹，...，2^n-1，padding为卷积填充，n层的卷积填充分别为1、2¹，...，2^n-1，其中size为特征图大小；

步骤2.3.3：每层空洞卷积层后跟ReLU激活函数；

步骤2.3.4：空洞卷积块各层输出相加，得到此块最后的输出；

步骤2.4：空洞卷积块后构建并连接解码器，解码器由五段组成，若特征图尺寸提前达到则可提前跳出解码器；然后ResNet编码器各layer的输出与解码器各个段相同尺寸的特征图跳跃拼接；所述跳跃拼接具体为，由ResNet编码器各层输出的特征图，与解码器各段输出的相同尺寸的特征图进行跳跃拼接，拼接后的特征图输入到解码器的下一个段；

所述解码器的搭建步骤如下：

步骤2.4.1：先连接一个卷积核大小为1的卷积层，然后经Batch Norm和ReLU激活函数处理；

步骤2.4.2：再连接一个转置卷积：

ConvTranspose2d(kernel_size＝3,stride＝2,padding＝1,output_padding＝1)

ConvTranspose2d()为转置卷积函数，转置卷积核大小为3，stride为步长，卷积填充为1，输出特征图填充为1，然后经Batch Norm和ReLU激活函数处理；

步骤2.4.3：最后连接一个卷积核大小为1的卷积层，然后经Batch Norm和ReLU激活函数处理；

步骤2.4.4：将步骤2.4.1至步骤2.4.3封装为一段，按此流程循环构建五段；

步骤2.5：解码器后构建并连接道路析出块，道路析出块的构建包括：

步骤2.5.1：连接一个转置卷积层，然后经Batch Norm和ReLU激活函数处理，使特征图大小变为原图像大小；

步骤2.5.2：连接三个卷积核大小为3，卷积填充为1，步长为1的卷积层，使特征图数量降为1，每两个特征图之间进行ReLU激活函数处理；

步骤2.5.3：连接一个Sigmoid激活函数，得到与输入图像大小相同、单通道的结果图像。

3.根据权利要求1所述的一种基于双编码器网络模型的遥感影像道路提取方法，其特征在于，所述训练模型训练时，初始学习率为2e-4，若连续三轮以上损失值不下降，则学习率衰减5倍，连续六轮损失值不下降，则默认训练完成，单卡RTX3060训练。