[发明专利]基于修正的CycleGAN模型的声纳图像库构建方法在审
申请号: | 202010985999.5 | 申请日: | 2020-09-18 |
公开(公告)号: | CN112148906A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 谢奎;凡志邈;刘雪;夏伟杰;卞俊;寿怀韬;姚可为 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/55;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 施昊 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 修正 cyclegan 模型 声纳 图像 构建 方法 | ||
1.基于修正的CycleGAN模型的声纳图像库构建方法,其特征在于,包括以下步骤:
(1)准备光学图像数据集和声纳图像数据集,分别放在源域和目标域;
(2)设置初始化参数,包括初始学习率、批大小、优化器的选择以及用于约束各损失函数占比的超参数;
(3)改进CycleGAN模型的损失函数,根据改进的损失函数训练模型,并采用优化器进行优化;
(4)训练过程中生成器与其对应的鉴别器交替更新,观察判别器损失曲线是否满足纳什均衡条件;
(5)CycleGAN模型训练结束,导出模型;
(6)向训练好的模型输入用于测试的光学图像进行测试,生成对应的声纳图像;
(7)设计目标检测网络验证构建的声纳图像数据集的有效性。
2.根据权利要求1所述基于修正的CycleGAN模型的声纳图像库构建方法,其特征在于,在步骤(3)中,所述改进的损失函数如下:
上式中,LGAN为改进的损失函数,G为生成器,D为鉴别器,X为源域,Y为目标域,E表示数据期望,x为源域样本,y为目标域样本,x~Pdata(x)表示源域样本的概率分布,y~Pdata(y)表示目标域样本的概率分布,表示求D(x)梯度的p范数,Lidt为恒等损失,λw和λidt为超参数。
3.根据权利要求2所述基于修正的CycleGAN模型的声纳图像库构建方法,其特征在于,在步骤(3)中,所述恒等损失Lidt如下:
上式中,F为G的逆向映射。
4.根据权利要求1所述基于修正的CycleGAN模型的声纳图像库构建方法,其特征在于,在步骤(3)中,所述优化器采用Adam优化器。
5.根据权利要求1所述基于修正的CycleGAN模型的声纳图像库构建方法,其特征在于,在步骤(4)中,通过Tensorboard观察判别器损失曲线是否满足纳什均衡条件。
6.根据权利要求1所述基于修正的CycleGAN模型的声纳图像库构建方法,其特征在于,步骤(7)的具体过程如下:
(7a)将构建的声纳图像数据集按照目标进行分类,分别用每一类目标数据集训练MaskRCNN模型,训练结束后导出Mask RCNN模型;
(7b)利用前视二维成像声纳采集真实的声纳图像测试训练后的Mask RCNN模型,得出相应的目标检测结果;
(7c)将步骤(7a)中构建的所有种类的声纳图像合为一个训练集,重复步骤(7a)中的模型训练,并导出训练后的Mask RCNN模型;
(7d)利用成像声纳采集含有多个目标的声纳图像,测试步骤(7c)中得到的Mask RCNN模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010985999.5/1.html,转载请声明来源钻瓜专利网。