[发明专利]基于自注意力卷积神经网络的声呐图像分类系统及方法在审
申请号: | 202211506827.0 | 申请日: | 2022-11-28 |
公开(公告)号: | CN116246092A | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 汪林;冯朝;雷敏 | 申请(专利权)人: | 宜昌测试技术研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/26;G06V10/30;G06V10/44;G06N3/0464 |
代理公司: | 北京艾纬铂知识产权代理有限公司 16101 | 代理人: | 袁瑞霞 |
地址: | 443003 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 卷积 神经网络 声呐 图像 分类 系统 方法 | ||
1.一种基于自注意力卷积神经网络的声呐图像分类系统,其特征在于,包括声呐图像预处理模块、多层二维卷积神经网络、自注意力层以及多层感知机;
其中声呐图像预处理模块用来对原始声呐图像进行预处理,消除原始声呐图像数据中的干扰,预处理后的声呐图像作为多层二维卷积神经网络输入;所述多层二维卷积神经网络包括五个二维卷积层和三个最大池化层,该网络共划分为三个Block块,每个Block块均由一定数量的二维卷积层和最大池化层组成,在每个Block均使用了不同卷积核大小的卷积层;所述自注意力层放置于多层二维卷积神经网络之后,与多层二维卷积神经网络相匹配和适应,在训练中自动更新相应的参数,实现重要特征的捕获;所述多层感知机包括两层全连接神经网络层以及一个Softmax层,用于提取和处理多层二维卷积神经网络的输出特征,同时根据特征进行目标输出。
2.如权利要求1所述的系统,其特征在于,所述多层二维卷积神经网络的三个Block块为Block1、Block2和Block3,Block1由两个卷积核大小为3×3的二维卷积层以及一个步长为2的最大池化层组成;Block2由两个卷积核大小为5×5的二维卷积层以及一个步长为2的最大池化层组成;Block3由一个卷积核大小为7×7的二维卷积层以及一个步长为2的最大池化层组成。
3.如权利要求1或2所述的系统,其特征在于,所述声呐图像预处理包括声呐图像滤波与几何校正。
4.如权利要求3所述的系统,其特征在于,利用引导滤波对原始声呐图像进行相应的去噪处理。
5.如权利要求3所述的系统,其特征在于,通过分析声呐数据将多种几何校正系统相结合,有针对性的对不同原因产生的几何畸变分别进行校正。
6.如权利要求1或2所述的系统,其特征在于,所述多层感知机中,第一个全连接层其神经元数量设置为160;第二个全连接层其神经元数量根据目标分类数量来进行设置,不同的目标分类数对应的神经元不同。
7.如权利要求1或2所述的系统,其特征在于,所述多层感知机中,在两个全连接中之间设置了一个丢弃层,其丢弃率设置为0.6。
8.如权利要求1或2所述的系统,其特征在于,使用交叉损失函数来训练神经网络,使用梯度优化函数来对神经网络进行优化。
9.一种基于自注意力卷积神经网络的声呐图像分类方法,其特征在于,采用如权利要求1-8任意一项所述系统实现分类,包括如下步骤:
步骤1:输入声呐原始图像到声呐图像预处理模块;所述声呐原始图像由相应的声呐设备进行声呐数据采集,然后转换成相应的声呐图像作为预处理的输入;
步骤2:在声呐图像预处理模块中,将步骤1所传递过来的声呐原始图像作为输入进行声呐图像预处理,得到预处理后的图像;
步骤3:对预处理后的图像进行数据分割和统一转换;
步骤4:将处理后的图像数据作为多层二维卷积神经网络的输入来进行细粒度特征提取;
步骤5:将步骤4输出的结果,通过相应协议传送给中控,然后进行显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宜昌测试技术研究所,未经宜昌测试技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211506827.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于CAN收发器的装置、收发器及方法
- 下一篇:用于可调整预燃室的系统和方法