[发明专利]基于神经网络可视化的声呐图像自动目标识别方法在审
申请号: | 202110275720.9 | 申请日: | 2021-03-15 |
公开(公告)号: | CN113052215A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 郑荣濠;楼冠廷 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 可视化 声呐 图像 自动 目标 识别 方法 | ||
1.一种基于神经网络可视化的声呐图像自动目标识别方法,其特征在于,包括如下步骤:
1)使用ResNet-18分类主干网络和Grad-CAM神经网络可视化搭建自动目标识别模型;其中,Grad-CAM模块置于ResNet-18分类主干网络的全连接层前;
2)基于ImageNet光学数据集和自适应实例正则化风格转换技术构建形状偏好数据集,利用形状偏好数据集对自动目标识别模型进行预训练,获取对形状特征鲁棒的预训练参数,
3)利用标记了样本类别的声呐图像作为训练集,对步骤2)预训练后的自动目标模型进行再训练;
4)将待识别样本输入经再训练后的自动目标识别模型,得到分类类别,基于Grad-CAM模块得到指示目标位置的可视化热力图;对热力图高亮部分使用最小外接矩形法获得具体目标位置。
2.根据权利要求1所述的基于神经网络可视化的声呐图像自动目标识别方法,其特征在于,所述的Grad-CAM模块,其结构为其中Ai表示最终输出的n张特征图中的1张,其对样本被分类到某一类别c的影响权重记为ReLU为激活函数,使得可视化时只关注与类c正相关的区域。
3.根据权利要求2所述的基于神经网络可视化的声呐图像自动目标识别方法,其特征在于,
由识别模型判定样本为类c的总得分对每个特征图像素求导得到:
式中Sc表示全连接层判定样本被分类到某一类别c的得分,是一张大小为i1×i2的特征图i中某一点的像素值;由于代表的是特征图的平均权重,进一步除以以求平均,由此,Grad-CAM模块一般化的结构为:
4.根据权利要求1或2所述的基于神经网络可视化的声呐图像自动目标识别方法,其特征在于,所述ResNet-18分类主干网络由1个初始卷积层、4个卷积单元和1个全连接层组成;每个卷积单元由两个卷积层和一个跳跃连接层组成。
5.根据权利要求1所述的基于神经网络可视化的声呐图像自动目标识别方法,其特征在于,所述步骤2)中,基于ImageNet光学数据集和自适应实例正则化风格转换技术构建形状偏好数据集,具体为:
ImageNet光学数据集获取背景为海洋场景的部分数据,作为基础光学数据集;
利用Painter by Numbers数据集作为风格数据集,之后基于VGG-19实现AdaIN风格转换生成形状偏好光学数据集,AdaIN的具体描述如下:
式中,x是内容图像,y是风格图像,μ和σ分别表示均值和标准差。
6.根据权利要求1所述的基于神经网络可视化的声呐图像自动目标识别方法,其特征在于,所述步骤3)中,训练集中的声呐图像调整为统一像素尺寸,如果声呐图像中有多个目标,以居于中央最明显的目标作为该声呐图像的样本类别。
7.根据权利要求1所述的基于神经网络可视化的声呐图像自动目标识别方法,其特征在于,所述步骤4)中,
对热力图高亮部分使用最小外接矩形法获得具体目标位置具体为:
通过设定灰度阈值,对热力图中高亮部分求取其最小外接矩形,该矩形在热力图中的位置即对应于原图中目标位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110275720.9/1.html,转载请声明来源钻瓜专利网。