[发明专利]基于深度卷积生成对抗网络的铝电解火眼图像修补方法在审
申请号: | 202010012947.X | 申请日: | 2020-01-07 |
公开(公告)号: | CN111192221A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 陈晓方;潘慕尧;谢永芳;谢世文 | 申请(专利权)人: | 中南大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 黄艺平 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 卷积 生成 对抗 网络 电解 火眼 图像 修补 方法 | ||
1.一种基于Wasserstein深度卷积生成对抗网络的铝电解火眼图像修补方法,其特征在于,所述方法包括:
步骤1,对图像进行预处理:提取以火眼中心为中心,边长为400p的正方形的火眼图像;
步骤2,使用Wasserstein距离定义为生成器的loss;
步骤3,优化算法改为RMSProp优化算法;
步骤4,根据提取W-DCGAN生成模型进行图像修补。
2.如权利要求1所述的方法,其特征在于,所述步骤1进一步包括:只取以火眼中心为中心,边长为400p的正方形的火眼图像,由于图像是二值图,可以直接获取到火眼部分的图像左下角(xl,yl)和右上角的坐标(xr,yr);然后根据公式(xc,yc)=((xl+xr)/2,(yl+yr)/2)可获得火眼中心坐标,最后提取图像的左下角坐标和右上角坐标为(xl-100,yl-100),(xl+100,yl+100)。
3.如权利要求2所述的方法,其特征在于,所述步骤2进一步包括:
Wasserstein距离(Earth-Mover(EM)距离),定义如下:
其中,∏(Pr,Pg)是Pr和Pg组合起来的所有可能的联合分布的集合,∏(Pr,Pg)中每一个分布的边缘分布都是Pr和Pg,对于每一个可能的联合分布γ而言,从中采样(x,y)~γ得到一个真实样本x和一个生成样本y,并算出这对样本的距离||x-y||,计算该联合分布γ下样本对距离的期望值E(x,y)~y[||x-y||];在所有可能的联合分布中能够对这个期望值取到的下界定义为Wasserstein距离,
然后,把Wasserstein函数定义为生成器的loss,但是Wasserstein距离定义中的没法直接求解,转化为如下形式:
其中,在一个连续函数f上面额外施加了一个限制,要求存在一个常数K≥0使得定义域内的任意两个元素x1和x2都满足:|f(x1)-f(x2)|≤K|x1-x2|,此时函数f的Lipschitz常数为K,要求函数f的Lipschitz常数||f||L不超过K的条件下,对所有可能满足条件的f取到的上界,然后再除以K;此时下式可以近似变为:
而f可以用一个带参数w的神经网络来表示,同时满足下式中||fw||L≤K这个限制,再构造一个含参数w、最后一层不是非线性激活层的判别器网络fw,在限制w不超过某个范围的条件下,使得:
此时L就会近似真实分布与生成分布之间的Wasserstein距离,其数值越小,表示真实分布与生成分布的Wasserstein距离越小,模型训练得越好。
4.如权利要求3所述的方法,其特征在于,所述步骤3进一步包括:所述RMSProp优化算法对梯度计算了微分平方加权平均数,有利于消除了摆动幅度大的方向,用来修正摆动幅度,使得各个维度的摆动幅度都较小。
5.如权利要求4所述的方法,其特征在于,所述步骤4进一步包括:使用W-DCGAN在Chars74K公共数据集上进行训练,实验收敛后提取本方法的生成模型,再将火眼图像当做训练集微调生成模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010012947.X/1.html,转载请声明来源钻瓜专利网。