[发明专利]一种基于生成对抗机制的多人表情迁移方法有效
申请号: | 202010494513.8 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111798546B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 刘勇;张江宁 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06T13/40 | 分类号: | G06T13/40;G06V40/16 |
代理公司: | 浙江传衡律师事务所 33387 | 代理人: | 叶卫强 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 机制 表情 迁移 方法 | ||
1.一种基于生成对抗机制的多人表情迁移方法,其特征在于,包括Landmark转换器(ψ)和人脸生成器所述Landmark转换器(ψ)是由多个全连接层、ReLU激活函数层组成,
输入参考人员静止状态下landmark向量待迁移表情landmark向量分别经网络结构网络结构提取图像特征后由网络结构进一步进行特征融合,这样经过网络结构和后得到偏置landmark向量(lshift),其值代表每个landmark向量相对于参考人员静止状态landmark向量的偏移量,最后偏置landmark向量(lshift)通过和参考人员静止状态landmark向量相加输出参考人员表情迁移后的landmark向量从而完成在landmark向量几何空间上的表情迁移;
Landmark转换器(ψ)生成的参考人员表情迁移后的landmark向量在送入人脸生成器前需转换为参考人员表情迁移后的landmark图像其方式为以参考人员表情迁移后的landmark向量包含的每一个landmark坐标点为中心,在128*128大小的图像上画半径为2的实心圆;
所述人脸生成器是由多个卷积层、反卷积层、批归一化层和ReLU激活函数层组成,输入参考人员图像参考人员表情迁移后的landmark向量分别经网络结构网络结构提取图像特征后由网络结构进一步进行特征融合,最后经网络结构解码得到参考人员表情迁移后的图像
在进行前向推理时,输入参考人员静止状态landmark向量和迁移表情landmark向量先通过Landmark转换器(ψ)生成参考人员表情迁移后的landmark向量并将之转化为landmark图像形式然后和参考人员图像一起送入人脸生成器生成参考人员表情迁移后的图像
使用不同的迁移表情landmark向量和不同的参考人员图像作为输入,生成不同的参考人员表情迁移后的图像这样使用一个模型即可实现了多人表情迁移。
2.根据权利要求1中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,所述Landmark转换器(ψ)在训练时,除了采用L1损失函数,还额外使用对抗思路设计了landmark真假鉴别器(DTF)和身份鉴别器(DS)去进一步增强网络回归landmark的准确性。
3.根据权利要求1中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,所述Landmark转换器(ψ)包含和由6层全连接和激活函数组成,由5层全连接和激活函数组成,由5层全连接和激活函数组成。
4.根据权利要求2中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,所述landmark真假鉴别器(DTF)由6层全连接和激活函数组成,身份鉴别器(DS)由6层全连接和激活函数组成。
5.根据权利要求1中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,人脸生成器在训练时,采用L1损失函数进行像素级别的约束,同时采用了对抗思想的图像鉴别器(Dimg)以进一步增加生成图像的真实性。
6.根据权利要求1中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,网络结构由3层卷积层组成,网络结构由6层卷积层组成,网络结构由18层卷积层组成,网络结构φ4由2层反卷积层和1层卷积层组成。
7.根据权利要求5中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,所述图像鉴别器(DTF)由6层卷积层和激活函数组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010494513.8/1.html,转载请声明来源钻瓜专利网。