[发明专利]基于动态自注意力Transformer的面向对象土地利用信息解译方法在审
申请号: | 202110810082.6 | 申请日: | 2021-07-18 |
公开(公告)号: | CN113591633A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 崔巍;夏聪;王锦;郝元洁;李解;吴伟杰;王梓溦 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 注意力 transformer 面向 对象 土地利用 信息 解译 方法 | ||
本发明提供了一种基于动态自注意力Transformer的面向对象土地利用信息解译方法,包括如下步骤:数据获取;数据预处理;建立分类体系;对象掩码制作;人工标注;样本制作;数据集切分;构建网络模型;超参数设置;数据增强;模型训练;验证分析。本发明的目的是提供一种面向对象的地震灾后土地利用信息解译的方法,设计出了基于动态自注意力机制的视觉Transformer,可在减少Transformer计算复杂度的同时充分利用其优异的全局感知能力,负责扩大感受野、建立上下文依赖和全局建模,以实现高分遥感影像的土地利用信息的解译。
技术领域
本发明涉及面向对象的遥感影像语义分割技术领域,尤其涉及一种基于动态自注意力Transformer的面向对象土地利用信息解译方法。
背景技术
近年来随着深度学习方法的迅速发展,各项计算机视觉任务(如图像分类、语义分割、目标检测)的性能得到显著的提升,极大推动了遥感影像解译技术的扩展,特别在高分辨遥感影像领域。
现有的基于深度学习的遥感影像语义分割网络(如FCN、UNet、DeepLab等)主要为全卷积架构,卷积神经网络虽然能够学习图像中丰富的局部空间特征,如边缘和纹理,但也存在着缺乏上下文长期依赖、感受野受限等一些弊端。但近年由于来Transformer优异的全局感知能力,逐渐在自然语言处理、计算机视觉等多项任务中完成对卷积神经网络超越。Transformer最初应用在自然语言处理邻域,该方法主要应用了自注意力(Self-Attention,SA)机制,能捕捕获句子中单词之间的全局交互,而不同于卷积神经网络的局部感知。鉴于Transformer在自然语言处理邻域的优异表现,该方法逐渐被迁移到计算机视觉任务中。但由于Transformer的SA机制,Transformer的内存消耗量与计算量与输入影像大小呈二次方的关系,极大限制了Transformer在计算机视觉领域的应用。
综合上述分析可知,现有的方法存在计算复杂度高且信息解译效果不佳的问题。
发明内容
本发明提出一种基于动态自注意力Transformer的面向对象土地利用信息解译方法,用于解决或者至少部分解决现有技术中存在的计算复杂度高且信息解译效果不佳的技术问题。
为了解决上述技术问题,本发明提供了一种基于动态自注意力Transformer的面向对象土地利用信息解译方法,包括:
S1:获取地震灾区所在区域的矢量边界以及高分辨率遥感影像,根据地震灾区所在区域的矢量边界以及高分辨率遥感影像获得样本图,并划分得到训练集;
S2:构建基于动态自注意力Transformer的面向对象土地利用信息解译模型,其中,该信息解译模型包括Backbone模块、Neck模块以及Head模块,Backbone模块为卷积神经网络特征提取模块,用于提取影像的纹理和边界,为三维局部特征;Neck模块为视觉Transformer特征提取模块,基于动态自注意力机制构建视觉Transformer,用于建立视觉特征的全局信息和长期依赖;Head模块为图Transformer节点聚合模块,通过构建图Transformer以聚合图节点并生成对象类别预测结果,对象类别预测结果作为面向对象土地利用信息解译结果;
S3:利用划分得到的训练集对信息解译模型进行训练,并进行超参数的设置,将得到的最优模型作为训练好的信息解译模型;
S4:利用训练好的信息解译模型对面向对象土地利用信息进行解译。
在一种实施方式中,步骤S1中根据地震灾区所在区域的矢量边界以及高分辨率遥感影像获得样本,包括:
对获取的矢量边界以及高分辨率遥感影像,进行预处理;
根据灾区高分辨率遥感影像的目视解译结果以及国家相关土地利用分类标准,建立研究区域土地分类体系;
对预处理后的高分辨率遥感影像进行超像素分割,生成对象掩码;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110810082.6/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法