[发明专利]基于修正的CycleGAN模型的声纳图像库构建方法在审
申请号: | 202010985999.5 | 申请日: | 2020-09-18 |
公开(公告)号: | CN112148906A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 谢奎;凡志邈;刘雪;夏伟杰;卞俊;寿怀韬;姚可为 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/55;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 施昊 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 修正 cyclegan 模型 声纳 图像 构建 方法 | ||
本发明公开了基于修正的CycleGAN模型的声纳图像库构建方法,在CycleGAN模型基础上,对网络模型的损失函数进行改进实现声纳图像库的构建,即利用光学图像构建声纳图像,实现光学图像到声纳图像的风格迁移。通过对CycleGAN网络损失函数的改进,提高了声纳图像合成效果,并设计目标检测网络以验证构建的声纳图像数据集的有效性。
技术领域
本发明属于声纳图像处理领域,特别涉及了一种声纳图像库构建方法。
背景技术
近年来随着海洋水声探测行业的蓬勃发展,受水中介质复杂性影响,电磁波易被吸收,导致在水中的传播距离很短,难以实现远距离探测任务,而声波在水中可传播数十公里,是一种较为理想的传播信号。低频段下,声波传播距离较远,可以直接利用回波信号的频谱等特征实现噪声识别工作(如舰船噪声);而高频阶段,在几百米范围内可以实现声纳目标的成像,目前成像声纳逐渐成为海洋水声探测行业的必需设备之一。由于水下环境复杂,实际作业难度大,难以获取大量数据样本,然而目前许多水下工程研究都需要较大的数据样本,如利用深度学习实现水下目标分类与检测网络的训练需要大量的声纳图像,而现实中无法收集到大量的声纳图像。
随着人工智能领域的发展,很多研究工作的开展也应用了机器学习领域相关的技术。但是很多神经网络的训练都需要大量的训练数据,因此构建充足的声纳图像数据库成为很多水下研究工作的重要前提条件。
发明内容
为了解决上述背景技术提到的技术问题,本发明提出了基于修正的CycleGAN模型的声纳图像库构建方法。
为了实现上述技术目的,本发明的技术方案为:
基于修正的CycleGAN模型的声纳图像库构建方法,包括以下步骤:
(1)准备光学图像数据集和声纳图像数据集,分别放在源域和目标域;
(2)设置初始化参数,包括初始学习率、批大小、优化器的选择以及用于约束各损失函数占比的超参数;
(3)改进CycleGAN模型的损失函数,根据改进的损失函数训练模型,并采用优化器进行优化;
(4)训练过程中生成器与其对应的鉴别器交替更新,观察判别器损失曲线是否满足纳什均衡条件;
(5)CycleGAN模型训练结束,导出模型;
(6)向训练好的模型输入用于测试的光学图像进行测试,生成对应的声纳图像;
(7)设计目标检测网络验证构建的声纳图像数据集的有效性。
进一步地,在步骤(3)中,所述改进的损失函数如下:
上式中,LGAN为改进的损失函数,G为生成器,D为鉴别器,X为源域,Y为目标域,E表示数据期望,x为源域样本,y为目标域样本,x~Pdata(x)表示源域样本的概率分布,y~Pdata(y)表示目标域样本的概率分布,表示求D(x)梯度的p范数,Lidt为恒等损失,λw和λidt为超参数。
进一步地,在步骤(3)中,所述恒等损失Lidt如下:
上式中,F为G的逆向映射。
进一步地,在步骤(3)中,所述优化器采用Adam优化器。
进一步地,在步骤(4)中,通过Tensorboard观察判别器损失曲线是否满足纳什均衡条件。
进一步地,步骤(7)的具体过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010985999.5/2.html,转载请声明来源钻瓜专利网。