[发明专利]基于级联残差生成对抗网络的SAR和光学图像双向翻译方法在审
申请号: | 201910275216.1 | 申请日: | 2019-04-04 |
公开(公告)号: | CN111784560A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 徐丰;符士磊;金亚秋 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00 |
代理公司: | 上海元一成知识产权代理事务所(普通合伙) 31268 | 代理人: | 吴桂琴 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 级联 生成 对抗 网络 sar 光学 图像 双向 翻译 方法 | ||
1.基于级联残差生成对抗网络的SAR和光学图像双向翻译方法,其特征在于,其包括步骤:
(1)从数据集中挑选部分SAR图像和对应的光学图像,并对之严格配准;
(2)对所有将使用的SAR和光学图像预处理,包括降噪、归一化和切片;
(3)采用监督学习的方式,将严格配对的SAR和光学图像送入多尺度残差生成对抗网络中,迭代训练该模型;
(4)采用非监督学习的方式,利用拓展数据集中非配对的光学或SAR图像,迭代训练待测试的图像,改善翻译结果;
所述的多尺度残差生成对抗网络,基于U-Net网络结构,主体添加了skip connections的encoder-decoder结构,并在此基础上添加输入到decoder中间各层的连接;
所述的监督学习,是指馈送到网络中的训练样本是严格配对的,翻译得到的图像有对应的真值逐像素地对比,有利于目标空间位置的对应和网络的稳定训练;
所述的非监督学习,是指基于少量严格配对样本预训练的级联残差对抗网络。
2.根据权利要求1所述的方法,其特征在于,所述的多尺度残差生成对抗网络,主要包括,(1a)网络结构基于U-Net,主体添加skip connections的encoder-decoder结构,能规避自编码器的信息瓶颈导致的信息丢失;白包括,将输入根据解码器中特征图的尺度相应地降采样,并将降采样后的图像直接跳连接到解码器的各个特征图中,由此鼓励网络中各个尺度的特征图学习到与输入之间的差距,该网络等效于学习输入与输出之间差距的残差网络;残差的加入可以消除训练解码器过程中可能出现的梯度消失的问题;
(1b)损失函数基于Pix2Pix的网络,鉴别器的损失函数满足:
其中当i=0,1时,pdata(i)分别表示真实光学和SAR图像的分布,表示x服从pdata(i)分布,表示z服从pdata(j)分布。z表示输入SAR(或光学)图像,T(z)表示翻译的光学(或SAR)图像,x表示对应的真实光学(或SAR)图像,D(□)表示鉴别器的输出概率图,对于鉴别器,最小化L(D)等同于将x分类为1,将T(z)分类为0;
遵循对抗原则,翻译器的损失函数是
其中LGAN(T)是两个翻译器的loss总和。跟鉴别器的目标相反,翻译器希望生成足够真实的图像,以欺骗鉴别器将它们分类为1;
对抗损失函数辅以传统的loss训练,如L1或L2 loss;额外的衡量翻译图像T(z)和真实图像x之间距离的L1范数的loss用于训练翻译器;
将上面两个等式加权组合在一起,得到翻译器的最终的损失函数L(T)
L(T)=LGAN(T)+βLL1(T) (公式四)
L(T)是两个翻译器的目标函数,它们的参数同时更新;两个鉴别器分别有一个损失函数L(D),且被分别训练;
(1c)训练过程,自适应矩估计(Adaptive Moment Estimation,Adam)训练算法用于同时训练两个翻译器/鉴别器,遵循GAN训练策略,一次迭代包括以下步骤:
a)前向传播——首先,随机初始化一对翻译器和一对鉴别器,然后一小批SAR图像被送入翻译器A,生成假的光学图像,同时一小批光学图像被送到翻译器B,生成假的SAR图像,继而,将真假光学图像相继送到同一个鉴别器A,分别生成两个概率图,真假SAR图像则被送到鉴别器B,也分别生成两张概率图;
b)后向传播——比较真假光学图像的两张概率图的差异并作为loss用于优化鉴别器A,同时SAR图像的概率图的差异用于优化鉴别器B;该两个loss相加作为翻译器的GANloss,翻译器需要最大化它们;还将直接比较真值和重构图像的像素级的差异,以确保目标的位置一一对应;混合的loss被作为两个翻译器的最终的损失函数,然后应用反向传播,以同时调整两个翻译器的可训练参数;
前向传播和后向传播交替进行:batch size设置为1,使用4块NVIDIA Titan X的GPU并行加速技术,同时输入4对SAR和光学图像,每次前向传递一对图像生成对应的假的图像,可根据损失函数计算可训练参数的梯度;当四个线程的梯度都计算出来后,其均值被用于更新优化器;后向传播是单线程,当完成后向传播后;另外四对图像又被送入网络中;每个周期需要遍历完所有的图像,然后重新打乱图片的顺序,遍历下一个周期。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910275216.1/1.html,转载请声明来源钻瓜专利网。