[发明专利]基于动态自注意力Transformer的面向对象土地利用信息解译方法在审

申请号：	202110810082.6	申请日：	2021-07-18
公开（公告）号：	CN113591633A	公开（公告）日：	2021-11-02
发明（设计）人：	崔巍;夏聪;王锦;郝元洁;李解;吴伟杰;王梓溦	申请（专利权）人：	武汉理工大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/46;G06K9/62
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	罗飞
地址：	430070 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于动态注意力 transformer 面向对象土地利用信息解译方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于动态自注意力Transformer的面向对象土地利用信息解译方法，其特征在于，包括：

S1：获取地震灾区所在区域的矢量边界以及高分辨率遥感影像，根据地震灾区所在区域的矢量边界以及高分辨率遥感影像获得样本图，并划分得到训练集；

S2：构建基于动态自注意力Transformer的面向对象土地利用信息解译模型，其中，该信息解译模型包括Backbone模块、Neck模块以及Head模块，Backbone模块为卷积神经网络特征提取模块，用于提取影像的纹理和边界，为三维局部特征；Neck模块为视觉Transformer特征提取模块，基于动态自注意力机制构建视觉Transformer，用于建立视觉特征的全局信息和长期依赖；Head模块为图Transformer节点聚合模块，通过构建图Transformer以聚合图节点并生成对象类别预测结果，对象类别预测结果作为面向对象土地利用信息解译结果；

S3：利用划分得到的训练集对信息解译模型进行训练，并进行超参数的设置，将得到的最优模型作为训练好的信息解译模型；

S4：利用训练好的信息解译模型对面向对象土地利用信息进行解译。

2.如权利要求1所述的方法，其特征在于，步骤S1中根据地震灾区所在区域的矢量边界以及高分辨率遥感影像获得样本，包括：

对获取的矢量边界以及高分辨率遥感影像，进行预处理；

根据灾区高分辨率遥感影像的目视解译结果以及国家相关土地利用分类标准，建立研究区域土地分类体系；

对预处理后的高分辨率遥感影像进行超像素分割，生成对象掩码；

根据建立好的研究区域土地分类体系，对高分辨率遥感影像以及对应的对象掩码进行人工标注，生成研究区域GT；

根据研究区域土地类型分布情况与网络模型需要，选取最佳切割尺度，将大幅高分辨率遥感影像拆分成不重叠的样本图，并生成样本图对应的对象掩码、对象类别以及GT。

3.如权利要求2所述的方法，其特征在于，所述方法还包括：按照预设比例对样本图进行划分，得到训练集、验证集和测试集。

4.如权利要求1所述的方法，其特征在于，步骤S2中Backbone模块包括两个卷积层、一个池化层、两个卷积层和一个池化层。

5.如权利要1所述的方法，其特征在于，步骤S2中Neck模块的计算过程包括；

将Backbone模块的三维局部特征在空间维度进行展开，转换成为二维序列；