[发明专利]一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法在审
申请号: | 202210889544.2 | 申请日: | 2022-07-27 |
公开(公告)号: | CN115170943A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 赵玉新;郑良锋;朱可心;邓雄;卢志忠;杨德全;何健新;吴昌哲 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06V20/05 | 分类号: | G06V20/05;G06V10/764;G06V10/82;G06V10/94 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 改进 视觉 transformer 海底 底质 声呐 图像 分类 方法 | ||
1.一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法,其特征在于:包括以下步骤:
步骤1:获取用于训练的数据集;
需要已知图像所属的底质类型,获得n类海底底质声呐图像;
步骤2:将这些图像进行预处理操作;
预处理包括图像去噪、图像特征增强;
步骤3:获取用于预训练的源域图像;
步骤4:建立改进视觉Transformer网络;
包括前置卷积变换层、patch与位置嵌入层、transformer编码层和多层感知机输出层;层与层之间相互连接,组合成整个改进视觉transformer网络;
步骤5:在源域纹理图像上训练网络,获得预训练模型;
使用交叉熵损失函数,将纹理图像分为训练集和验证集输入网络进行网络训练;
步骤6:根据步骤2,依照4:1-7:1的比例设置训练集以及验证集的数量;
步骤7:将训练集中的图像与其实际类别输入网络中进行调整,每训练一轮在验证集上验证分类准确率;
步骤8:调整网络参数,获得训练后的Transformer分类器;
步骤9:将需要判断底质类型的声呐图像输入分类器,分类器自动输出分类结果。
2.根据权利要求1所述的一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法,其特征在于:步骤1中所选图像属于同一种底质类型,使用相同大小的声呐图像切片,网络采用100×100分辨率的输入图像。
3.根据权利要求1所述的一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法,其特征在于:步骤2具体包括:
步骤2.1:分别对海底底质声呐图像进行平滑去噪和特征增强;
步骤2.2:利用小波变换技术对经过平滑去噪和特征增强的海底底质声呐图像进行滤波;
步骤2.3:利用多级中值滤波方法对经过滤波后的海底底质声呐图像进行加强处理。
4.根据权利要求1所述的一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法,其特征在于:步骤4中各层结构具体为:
前置卷积变换层为:将输入的图片转换为12×12×512的特征图,输出的张量的维数为12×12×512,供后续patch嵌入操作;
Patch与位置嵌入层为:将前置卷积变换层输出的张量转换为能够为Transformer所使用的patch,记录各个patch的位置信息,同时加入一个类别token;
transformer编码层为:包括12个编码块和多头注意力结构,并且不改变张量的维度数;其中多头注意力结构使用了12个头,为含有12个q,k,v值,进行了如下计算:
headi=注意力(QWiQ,KWiK,VWiV)
多头注意力(Q,K,m=拼接(head1,…,heodi)WO
W矩阵是变换参数矩阵,Softmax函数可以将输入映射成各种类别的概率,函数如下:
其中h(x,yj)为对第j项的预测结果;
多层感知机输出层为:使用一层全连接层实现维度变换,以获得类别输出;输出为n维张量,n为样本的类别数,可直接得到输入图片所属类型。
5.根据权利要求1所述的一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法,其特征在于:步骤5以网络的输出与真实的输出间的差异为网络训练的依据,将训练集图像分割成多个Batch,批量输入网络进行训练;当网络的验证准确率不再提升时,训练完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210889544.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手指锁和解锁方法
- 下一篇:一种洗衣机的控制方法、装置、洗衣机及存储介质