[发明专利]基于深度卷积生成对抗网络的铝电解火眼图像修补方法在审
申请号: | 202010012947.X | 申请日: | 2020-01-07 |
公开(公告)号: | CN111192221A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 陈晓方;潘慕尧;谢永芳;谢世文 | 申请(专利权)人: | 中南大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 黄艺平 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 卷积 生成 对抗 网络 电解 火眼 图像 修补 方法 | ||
本发明公开了一种基于Wasserstein深度卷积生成对抗网络的铝电解火眼图像修补方法。在实际铝电解过程中,电解过程中会有大量碳渣脱落,还有火焰的干扰,使得大量火眼图像无法识别,大大降低了图像识别的准确率。本发明公开一种DCGAN与WGAN方法结合的图像修补方法,其中包括两部分:首先是对图像做个简单的预处理,取以火眼为中心,边长为400像素的正方形的火眼图像,这样可以防止其余图像的干扰特征。其次,对于本发明模型,综合DCGAN和WGAN的特点,使用其相结合的模型—Wasserstein深度卷积生成对抗网络(W‑DCGAN)模型。利用卷积网络特征提取能力加上使用Wasserstein函数辅以训练,最后使用RMSProp优化算法优化损失函数,之后将训练好的W‑DCGAN中的生成器模型部分抽取出来,用于图像修补的新网络结构。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于Wasserstein深度卷积生成对抗网络的铝电解火眼图像修补方法。
背景技术
铝电解槽电解质的过热度是指电解质温度与初晶温度的差值,一般认为,过热度维持在8一12℃左右比较适宜,既能维持铝电解过程的正常进行,又保证较低的能源损耗。因此,在生产过程中对过热度的判断也是尤为重要。目前国内把过热度分为高,正常,低三类,维持一个良好的过热度能降低铝电解过程中的能源损耗。但是在实际的铝电解过程中,对过热度不好直接测量。
随着深度学习的兴起,我们发现可以利用深度学习对火眼图像进行处理,利用计算机视觉,对火眼中电解质运动视频进行采集分析,建立火眼视频视觉分析模型,对过热度进行分析,进而识别电解槽的过热度,拟达到减少耗能的同时又能增加铝电解的产量的目的。但是,电解过程中会有大量碳渣脱落,还有火焰的干扰,使得大量火眼图像无法识别,大大降低了识别的准确率。实际图像在形成、传输的过程中,由于各种干扰因素的存在会受到噪声的污染。
近几年来,数字图像处理技术已经成为计算机视觉领域的一个研究热点,图像修复是图像处理的重要组成部分,是对图像中的受损区域进行信息填充的过程,其目的是恢复受损的图像,并使观察者无法察觉图像曾经缺损或已被修复。图像修补技术,指用图像中的已知部分区域来填充修补图像中的受损区域,比如污点,遮掩等等。随着图像处理技术的日益成熟,数字图像的应用领域越来越广。
生成式对抗网络(GAN,Generative Adversarial Networks)是一种深度学习模型,是lan Goodfellow在2014年提出的一个概念。生成对抗网络包括一个生成器(Generator,简称G)生成数据,一个判别器(Discriminator,简称D)来判别真实数据和生成数据。在训练时,生成网络G接收一个随机噪声z,通过这个噪声生成图片G(z),判别网络D来判断这张图片是不是真实数据。输入参数x,x表示一张图片,输出D(x)表示这张图片是真实图片的概率,输出值在0-1之间。生成器和判别器是一个对抗的关系,在训练过程中,两者是一个博弈的关系,生成网络尽量生成一个与真实图片相近的假图片去迷惑判别网络,而判别网络就是尽量把生成图片和真实图片分开来,两者一直对抗直到达到一个纳什均衡,生成器生成的数据与真实样本无差别,判别器也无法正确的区分生成数据和真实数据。图1是它的一个流程图。
但是训练GAN需要达到纳什均衡,有时候可以用梯度下降法做到,有时候却做不到,因为还没有找到一个稳定的可以达到纳什均衡的方法,所以训练 GAN是不稳定的。所以在GAN网络的基础上改进,出现了更好的深度卷积生成对抗网络(Deep ConvolutionalGenerative Adversarial Network,DCGAN) 和Wasserstein GAN(WGAN),本发明结合两者的特点建立Wasserstein深度卷积生成对抗网络(W-DCGAN)模型来进行火眼图像的修补。
发明内容
在实际铝电解过程中,电解过程中会有大量碳渣脱落,还有火焰的干扰,使得大量火眼图像无法识别,大大降低了图像识别的准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010012947.X/2.html,转载请声明来源钻瓜专利网。