[发明专利]一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法在审
申请号: | 202210889544.2 | 申请日: | 2022-07-27 |
公开(公告)号: | CN115170943A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 赵玉新;郑良锋;朱可心;邓雄;卢志忠;杨德全;何健新;吴昌哲 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06V20/05 | 分类号: | G06V20/05;G06V10/764;G06V10/82;G06V10/94 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 改进 视觉 transformer 海底 底质 声呐 图像 分类 方法 | ||
本发明公开了一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法,改进视觉Transformer分类方法属于一种深度学习方法。它将图像通过前置卷积处理形成patch,依次通过patch嵌入、位置嵌入transformer编码层和多层感知机输出层后得到分类结果。通过反向传播的方法最小化网络残差,以实现分类器的训练。深度学习目的是学习样本数据的内在规律和表示层次,具有很强的非线性拟合学习能力,能够有效发掘出同类图像之间的共同特征。通过多层编码层的堆叠,网络会逐步学习到全局、局部特征,会主动关注图像中“重要”的部分。
技术领域
本发明属于海底底质声学勘探、反演、图像分类技术与人工智能领域,具体涉及一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法。
背景技术
海底探测的目标是利用一定的技术手段获取海底底质的空间分布特性及其随时间的变化规律,是一种基于连续时空系统的模式研究。声波在海水中具有非常优越的传播特性,随着声呐技术的迅速发展,海底底质声呐图像已能够包含十分丰富的海底地貌及底质特征信息,根据海底底质声呐图像反演海底地形地貌,对于海底探究、水下、沉船打捞及深海保护具有重要意义。但受水下复杂声场环境和声呐设备性能的限制,声呐图像可能具有斑点噪声、边缘模糊等问题,这就对分类器的性能要求更为严格。
海底科学研究中,已经发展出多种海底声学探测技术,水下声学技术为探测海底浅部剖面乃至深部地层结构发挥了重要的作用。由于不同类型底质的声吸收系数、反射系数、表面粗糙度等参数具有显著差异性,传统的声学海底反演利用海底声反射特性对海底底质类型进行识别。这种方式大多基于一些声学指标以及经验公式,实际上这种反演方式虽然计算简单,但由于海底复杂的环境,分类准确率并不是很理想。
现代的声学海底底质分类以声呐系统获取的声呐图像为基础,结合机械取样方法获得的真实海底底质样品数据,利用分类算法建立底质类型自动分析模型,进而实现高效、准确的海底底质分类。Diesing利用随机森林算法对4种底质类型的声呐图像进行分类,得到的结果优于传统的目标分析法和地质统计分析法,也有许多国内外学者应用多种人工神经网络方法实现了对海底底质的分类识别。Chakraborty等应用自组织特征映射(SOFM)及学习向量量化(LVQ)神经网络方法对海底底质的分类识别进行了研究。唐秋华将GA与BP神经网络有效结合起来,实现了对海底基岩、砾石、砂、细砂以及泥等底质类型的自动分类识别,其中基岩、砾石、砂、细砂和泥的分类精度分别为92.2%、81.9%、89.3%、85.9%、88.2%。但是LVQ神经网络无法充分利用神经元并对初值敏感。而且BP神经网络存在收敛速度慢,初始化参数较为随机,易陷入局部最优等问题,算法运算效率不高,特别是网络层数较多,复杂度较大时,训练时间较长。之后出现了使用卷积神经网络,将声呐图像的纹理特征和统计量特征与CNN相结合,构建了一种分类器。该分类器能够实现底质的自动识别分类功能。但是普通的卷积神经网络在训练时存在过拟合问题,并且卷积神经网络由于原理的限制,无法有效获得较大视野范围内的全局信息与特征图的位置信息。即无法学习图片的长距离依赖,从而影响网络的分类性能。此外,深度学习方法需要大量的训练样本以获取图像的共同特征,而海底底质声呐图像数量的不足也限制了深度学习海底底质声呐图像分类准确率的提高。
发明内容
本发明的目的在于提供一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法。
本发明的目的通过如下技术方案来实现:
一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法,包括以下步骤:
步骤1:获取用于训练的数据集;
需要已知图像所属的底质类型,获得n类海底底质声呐图像;
步骤2:将这些图像进行预处理操作;
预处理包括图像去噪、图像特征增强;
步骤3:获取用于预训练的源域图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210889544.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手指锁和解锁方法
- 下一篇:一种洗衣机的控制方法、装置、洗衣机及存储介质