[发明专利]一种基于身份保持的跨风格人脸原型重建技术在审
申请号: | 202211280760.3 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115689868A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 庞孟;黄伟;陈盛博;周崟涛 | 申请(专利权)人: | 南昌大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06V10/774;G06V40/16 |
代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 李冲 |
地址: | 330031 江西省*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 身份 保持 风格 原型 重建 技术 | ||
1.一种基于身份保持的跨风格人脸原型重建技术,其特征在于,包括以下步骤:
S1:建立基于GAN的跨风格人脸原型重建模型,该模型包括一个生成器和两个多任务判别器,其中生成器由两个对称编码-解码结构子网络构成用来生成域A和域B两种风格人脸原型图片,两个多任务判别器分别作用于域A和域B用来预测所在域图片的身份标签和判定图片是否为真实原型;
S2:建立模型的损失函数引导模型的训练过程,最终使得生成器在转换不同域的人脸图片风格的同时能够保留图片的原有身份特征;
S3:将来自域A和域B的带有身份标签的人脸图片训练集输入到模型中进行模型训练,并构建测试集,查看训练好的模型在测试人脸图片上的人脸原型重建效果。
2.根据权利要求1所述的一种基于身份保持的跨风格人脸原型重建技术,其特征在于:所述步骤S1的具体过程是:
S11:构建生成器G:G包含两个对称的编码-解码结构子网络,即GA和GB,每个子网络都含有一个编码器和一个解码器;首先,GA通过编码器EncA为来自域A的输入图片x编码一个256维的身份特征同时GB通过编码器EncB为来自域B的输入图片y编码一个256维的身份特征随后,Px与一个50维的随机噪音向量进行串联并输入到解码器DecA中生成x在域B的原型图片Py与另一个50维的随机噪音向量进行串联并输入到解码器DecB中生成y在域A的原型图片最后,将被反馈回其对称的编码-解码子网络GB生成图片以逼近x在域A的真实原型(即xrp),同时也将被反馈回其对称的编码-解码子网络GA生成图片以逼近y在域B的真实原型(即yrp);
S12:构建判别器D和D=[Did,Dgan]是一个多任务判别器,其中Did是一个与身份相关的子判别器用来预测域B中人脸图片的身份;Did输出一个Nd维向量,其中最大值的位置对应于身份标签;Dgan是一个对抗性子判别器用来区分域B中的真实原型图片与GA生成的虚拟原型图片;类似于D,也是一个多任务判别器包括两个子判别器和输出一个Nd维向量来预测域A中输入人脸图片的身份,用来区分域A中的真假原型图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌大学,未经南昌大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211280760.3/1.html,转载请声明来源钻瓜专利网。