[发明专利]基于多通道注意力选择生成对抗网络的人脸修复方法有效
申请号: | 202010044569.3 | 申请日: | 2020-01-16 |
公开(公告)号: | CN111275638B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 朱宁波;曾乐;程秋锋 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 深圳市中原力和专利商标事务所(普通合伙) 44289 | 代理人: | 胡国良 |
地址: | 410001 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 通道 注意力 选择 生成 对抗 网络 修复 方法 | ||
本发明提供一种基于多通道注意力选择生成对抗网络的人脸修复方法,其包括以下步骤:S1、采集人脸数据并进行预处理;S2、建立人脸修复模型及损失函数;S3、第一阶段,学习图像生成子网Gi并初步修复图像;S4、第二阶段,产生中间输出图IG并学习多通道注意力图IA;S5、构建多通道注意力选择模型并输出最终合成图;S6、进行人脸修复。所述人脸修复模型包括生成器网络Gi、参数共享鉴别器D和多通道注意力选择网络Ga,所述损失函数包括不确定性像素损失函数和对抗性损失函数。本发明提供的人脸修复方法有效地学习不确定性图,以指导像素损失,从而实现更强大的优化,提供一种更优的人脸修复方法。
【技术领域】
本发明涉及深度学习和图像处理领域,尤其涉及一种基于多通道注意力选择生成对抗网络的人脸修复方法。
【背景技术】
在图像修复领域,尤其对于眼内绘画,尽管DNN(深度神经网络)可以产生语义上合理且看起来逼真的结果,但大多数深度学习技术都无法在照片中保留人物的身份。例如,DNN可以学会睁开一对闭合的眼睛,但所述DNN本身并不能保证新的眼睛将与原始人的特定眼部结构相对应。
GAN(Generative adversarial networks,生成对抗网络)是一种特定类型的深层网络,其中包括以鉴别器网络为代表的可学习的对抗损失功能。GAN已成功地用于从头开始生成面部,或在面部上绘制缺失区域,适合一般的面部操作。
一种GAN变体,即条件GAN(cGAN),可以用额外的信息约束生成器。通过加入统一身份的参照信息,则该GAN不必从头开始幻化纹理或结构,但仍将保留原始图像的语义,来产生高质量的个性化修复结果。然而在某些情况下,GAN仍然会失败,比如当一个人的眼睛被一缕头发遮住了一部分,或者有时不能正确地着色,就会产生一些奇怪的人工痕迹。
生成对抗网络三通道生成空间可能不足以适合学习良好的映射,扩大生成空间并学习自动选择机制以合成更细粒度的生成结果成为一种可行的尝试。而将多通道注意力选择GAN框架(SelectionGAN)用于图像修复任务成为可能。
因此,本发明提供一种基于多通道注意力选择生成对抗网络的人脸修复系统。
【发明内容】
为了解决人脸修复技术在个别条件下会出现图像遮挡、不正确的着色修复及奇怪人工修复痕迹等问题,本发明提供了一种基于多通道注意力选择生成对抗网络的人脸修复方法。
一种基于多通道注意力选择生成对抗网络的人脸修复方法,其包括以下步骤:
S1、采集人脸数据并进行预处理:获取同一个人的人脸图像对,包含睁眼和闭眼的图像,对收集到的图像进行预处理;
S2、建立人脸修复模型及损失函数:设计并构建人脸修复模型及损失函数,所述人脸修复模型基于条件对抗生成网络,所述人脸修复模型包括生成器网络Gi、参数共享鉴别器D和多通道注意力选择网络Ga,所述损失函数包括不确定性像素损失函数和对抗性损失函数;
S3、第一阶段,学习图像生成子网Gi并初步修复图像:学习图像生成子网Gi,所述图像生成子网Gi接收由标记的输入图像Ia和参考图像Rg组成的图像对,并初步修复所述图像对,生成修复图像I'g=Gi(Ia,Rg);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010044569.3/2.html,转载请声明来源钻瓜专利网。