[发明专利]一种基于卷积Transformer的遥感图像分类方法及系统在审
申请号: | 202210562253.2 | 申请日: | 2022-05-23 |
公开(公告)号: | CN115690479A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 陈辉;张甜 | 申请(专利权)人: | 安徽理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V20/10;G06V10/44;G06V10/54;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 朱文振 |
地址: | 232001 安徽省淮*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 transformer 遥感 图像 分类 方法 系统 | ||
1.一种基于卷积Transformer的遥感图像分类方法,其特征在于,所述方法包括:
S1、将预设大小的特征图经过第一层卷积后得到预设大小的一层卷积特征图;
S2、将所述一层卷积特征图输入到L-Conv模块中,以不少于2个的所述L-Conv模块处理所述一层卷积特征图,以得到L-Conv处理特征图,其中,所述L-Conv模块包括:卷积位置编码CPE层和局部特征提取LFE层,所述卷积位置编码CPE层通过深度卷积获取图像中特征的绝对位置信息,所述局部特征提取LFE层采用深度可分离卷积降维处理所述一层卷积特征图,进入第二层,第二层的卷积步长为2,对所述L-Conv处理特征图进行第二层卷积处理,以得到二层卷积处理特征图,以不少于2个的所述L-Conv模块连续处理所述二层卷积处理特征图,以得到二层卷积特征图;
S3、将所述二层卷积特征图输入Transformer模块,其中,所述Transformer模块包括:轻量级的卷积位置编码CPE层和全局特征提取GFE层,所述轻量级的卷积位置编码CPE层通过深度卷积来编码特征的位置信息,所述全局特征提取GFE层利用多头自注意力层对深层图像特征的长距离全局信息建模,以预设数目的所述Transformer模块连续处理所述所述二层卷积特征图,以得到轻量卷积特征图,平均池化所述轻量卷积特征图并经预置全连接层处理输出最终预测结果。
2.根据权利要求1所述的一种基于卷积Transformer的遥感图像分类方法,其特征在于,所述卷积位置编码(CPE)层通过使用深度卷积,以下述逻辑对图像特征进行位置编码:
CPE(Xin)=DWConv(Xin)
,其中H表示特征图的高度,W表示特征图的宽度,C表示输入的通道数,DWConv表示深度卷积。
3.根据权利要求1所述的一种基于卷积Transformer的遥感图像分类方法,其特征在于,所述步骤S2包括:
S21、给定输入图像
S22、通过特征提取器fec从所述输入图像提取到5个特征图:
S23、将提取到的所述特征图输入位置编码模块(PEM),以双线性插值处理所述特征图,据以得到相同空间维度特征图;
S24、拼接所述相同空间维度特征图,从而得到了拼接特征图对所述拼接特征图进行k×k的卷积操作,以生成位置映射
4.根据权利要求3所述的一种基于卷积Transformer的遥感图像分类方法,其特征在于,所述步骤S24包括:
S241、以下述逻辑处理所述相同空间维度特征图,从而得到了拼接特征图
S242、对所述拼接特征图进行k×k的卷积操作,以生成位置映射
5.根据权利要求1所述的一种基于卷积Transformer的遥感图像分类方法,其特征在于,所述局部特征提取LFE层采用深度可分离卷积来提取图像特征的局部纹理信息,其中,深度可分离卷积包括:深度卷积和逐点卷积,逐点卷积使用1×1的卷积核对不同通道上的特征图进行线性组合并输出,将经过位置编码后的特征图进行卷积操作,逐点卷积对不同深度的特征进行线性组合,在对特征图卷积的过程中分类通道和区域。
6.根据权利要求5所述的一种基于卷积Transformer的遥感图像分类方法,其特征在于,在进行所述深度可分离卷积之前,添加了一个1×1的逐点卷积来升维。
7.根据权利要求1所述的一种基于卷积Transformer的遥感图像分类方法,其特征在于,分别在所述L-Conv模块和所述Transformer模块中的每个输出上添加残差函数及归一化结构。
8.根据权利要求1所述的一种基于卷积Transformer的遥感图像分类方法,其特征在于,全局特征提取(GFE)层采用Transformer网络结构,所述Transformer包括:多头自注意力层和前馈网络层,每个子层前后都添加了正则化层和残差连接层,在所述前馈网络层使用GELU激活函数进行线性变换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210562253.2/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法