[发明专利]基于动态自注意力Transformer的面向对象土地利用信息解译方法在审
申请号: | 202110810082.6 | 申请日: | 2021-07-18 |
公开(公告)号: | CN113591633A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 崔巍;夏聪;王锦;郝元洁;李解;吴伟杰;王梓溦 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 注意力 transformer 面向 对象 土地利用 信息 解译 方法 | ||
1.基于动态自注意力Transformer的面向对象土地利用信息解译方法,其特征在于,包括:
S1:获取地震灾区所在区域的矢量边界以及高分辨率遥感影像,根据地震灾区所在区域的矢量边界以及高分辨率遥感影像获得样本图,并划分得到训练集;
S2:构建基于动态自注意力Transformer的面向对象土地利用信息解译模型,其中,该信息解译模型包括Backbone模块、Neck模块以及Head模块,Backbone模块为卷积神经网络特征提取模块,用于提取影像的纹理和边界,为三维局部特征;Neck模块为视觉Transformer特征提取模块,基于动态自注意力机制构建视觉Transformer,用于建立视觉特征的全局信息和长期依赖;Head模块为图Transformer节点聚合模块,通过构建图Transformer以聚合图节点并生成对象类别预测结果,对象类别预测结果作为面向对象土地利用信息解译结果;
S3:利用划分得到的训练集对信息解译模型进行训练,并进行超参数的设置,将得到的最优模型作为训练好的信息解译模型;
S4:利用训练好的信息解译模型对面向对象土地利用信息进行解译。
2.如权利要求1所述的方法,其特征在于,步骤S1中根据地震灾区所在区域的矢量边界以及高分辨率遥感影像获得样本,包括:
对获取的矢量边界以及高分辨率遥感影像,进行预处理;
根据灾区高分辨率遥感影像的目视解译结果以及国家相关土地利用分类标准,建立研究区域土地分类体系;
对预处理后的高分辨率遥感影像进行超像素分割,生成对象掩码;
根据建立好的研究区域土地分类体系,对高分辨率遥感影像以及对应的对象掩码进行人工标注,生成研究区域GT;
根据研究区域土地类型分布情况与网络模型需要,选取最佳切割尺度,将大幅高分辨率遥感影像拆分成不重叠的样本图,并生成样本图对应的对象掩码、对象类别以及GT。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:按照预设比例对样本图进行划分,得到训练集、验证集和测试集。
4.如权利要求1所述的方法,其特征在于,步骤S2中Backbone模块包括两个卷积层、一个池化层、两个卷积层和一个池化层。
5.如权利要1所述的方法,其特征在于,步骤S2中Neck模块的计算过程包括;
将Backbone模块的三维局部特征在空间维度进行展开,转换成为二维序列;
将二维序列输入构建的视觉Transformer中,对二维序列进行升序排序,得到新的序列;
对新的序列进行线性变换得到视觉Transformer自注意力机制的查询向量,分别进行一维卷积得到视觉Transformer自注意力机制的被查向量和内容向量;
对视觉Transformer自注意力机制的查询向量、被查向量和内容向量进行注意力与残差操作、归一化处理后得到信息聚合结果;
对信息聚合结果进行前馈神经网络计算与残差操作、归一化处理,得到归一化后的信息聚合结果;
将归一化后的信息聚合结果重新调整为原来的位置。
6.如权利要1所述的方法,其特征在于,步骤S3中Head模块的计算过程包括;
将对象平均特征作为输入,分别经过三次线性变化后得到图Transformer自注意力机制的查询向量、被查向量以及内容向量,其中每个对象为一个节点;
对图Transformer自注意力机制的查询向量、被查向量以及内容向量进行注意力与残差操作,进行各节点特征信息的聚合,得到聚合节点信息;
对聚合后的节点信息进行前馈神经网络计算与残差操作、归一化处理,得到归一化后的聚合节点信息;
对归一化处理后的聚合节点信息进行线性变换和规范化处理,将特征维度转化为分类类别数,得到节点的分类概率。
7.如权利要2所述的方法,其特征在于,在步骤S1之后,所述方法还包括:对样本图中包含的遥感影像的各波段进行归一化,以及在训练集中对样本影像和对象掩码进行随机翻转、随机旋转操作。
8.如权利要3所述的方法,其特征在于,所述方法还包括:在训练过程中对信息解译模型在训练集上验证各项评价指标分析模型的精度和泛化能力;在测试集中进行模型预测,与真实GT进行对比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110810082.6/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法