[发明专利]基于自注意力卷积神经网络的声呐图像分类系统及方法在审

申请号：	202211506827.0	申请日：	2022-11-28
公开（公告）号：	CN116246092A	公开（公告）日：	2023-06-09
发明（设计）人：	汪林;冯朝;雷敏	申请（专利权）人：	宜昌测试技术研究所
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/82;G06V10/26;G06V10/30;G06V10/44;G06N3/0464
代理公司：	北京艾纬铂知识产权代理有限公司 16101	代理人：	袁瑞霞
地址：	443003 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于注意力卷积神经网络声呐图像分类系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于自注意力卷积神经网络的声呐图像分类系统，其特征在于，包括声呐图像预处理模块、多层二维卷积神经网络、自注意力层以及多层感知机；

其中声呐图像预处理模块用来对原始声呐图像进行预处理，消除原始声呐图像数据中的干扰，预处理后的声呐图像作为多层二维卷积神经网络输入；所述多层二维卷积神经网络包括五个二维卷积层和三个最大池化层，该网络共划分为三个Block块，每个Block块均由一定数量的二维卷积层和最大池化层组成，在每个Block均使用了不同卷积核大小的卷积层；所述自注意力层放置于多层二维卷积神经网络之后，与多层二维卷积神经网络相匹配和适应，在训练中自动更新相应的参数，实现重要特征的捕获；所述多层感知机包括两层全连接神经网络层以及一个Softmax层，用于提取和处理多层二维卷积神经网络的输出特征，同时根据特征进行目标输出。

2.如权利要求1所述的系统，其特征在于，所述多层二维卷积神经网络的三个Block块为Block1、Block2和Block3，Block1由两个卷积核大小为3×3的二维卷积层以及一个步长为2的最大池化层组成；Block2由两个卷积核大小为5×5的二维卷积层以及一个步长为2的最大池化层组成；Block3由一个卷积核大小为7×7的二维卷积层以及一个步长为2的最大池化层组成。

3.如权利要求1或2所述的系统，其特征在于，所述声呐图像预处理包括声呐图像滤波与几何校正。

4.如权利要求3所述的系统，其特征在于，利用引导滤波对原始声呐图像进行相应的去噪处理。

5.如权利要求3所述的系统，其特征在于，通过分析声呐数据将多种几何校正系统相结合，有针对性的对不同原因产生的几何畸变分别进行校正。

6.如权利要求1或2所述的系统，其特征在于，所述多层感知机中，第一个全连接层其神经元数量设置为160；第二个全连接层其神经元数量根据目标分类数量来进行设置，不同的目标分类数对应的神经元不同。

7.如权利要求1或2所述的系统，其特征在于，所述多层感知机中，在两个全连接中之间设置了一个丢弃层，其丢弃率设置为0.6。

8.如权利要求1或2所述的系统，其特征在于，使用交叉损失函数来训练神经网络，使用梯度优化函数来对神经网络进行优化。

9.一种基于自注意力卷积神经网络的声呐图像分类方法，其特征在于，采用如权利要求1-8任意一项所述系统实现分类，包括如下步骤：

步骤1：输入声呐原始图像到声呐图像预处理模块；所述声呐原始图像由相应的声呐设备进行声呐数据采集，然后转换成相应的声呐图像作为预处理的输入；

步骤2：在声呐图像预处理模块中，将步骤1所传递过来的声呐原始图像作为输入进行声呐图像预处理，得到预处理后的图像；

步骤3：对预处理后的图像进行数据分割和统一转换；

步骤4：将处理后的图像数据作为多层二维卷积神经网络的输入来进行细粒度特征提取；

步骤5：将步骤4输出的结果，通过相应协议传送给中控，然后进行显示。