[发明专利]非线性3DMM人脸重建和姿态归一化方法、装置、介质及设备在审

专利信息
申请号: 201910820065.3 申请日: 2019-08-31
公开(公告)号: CN112215050A 公开(公告)日: 2021-01-12
发明(设计)人: 周军;刘利朋;江武明;丁松 申请(专利权)人: 北京眼神智能科技有限公司;北京眼神科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06T17/00;G06T15/00;G06N3/04
代理公司: 北京恩赫律师事务所 11469 代理人: 刘守宪
地址: 100085 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 非线性 dmm 人脸重 建和 姿态 归一化 方法 装置 介质 设备
【权利要求书】:

1.一种非线性3DMM人脸重建方法,其特征在于,所述方法包括:

使用训练集对非线性3DMM模型进行训练;

其中,所述训练集包括多个2D人脸图像样本,所述非线性3DMM模型包括CNN编码器、多层感知形状解码器、CNN纹理解码器和渲染层;

在训练时,输入所述非线性3DMM模型的2D人脸图像样本经过所述CNN编码器估计得到相机投影参数、形状参数和纹理参数,所述多层感知形状解码器将所述形状参数解码为3D形状,所述CNN纹理解码器将所述纹理参数解码为3D纹理,所述渲染层根据所述相机投影参数、3D形状和3D纹理得到渲染图像;通过损失函数训练所述CNN编码器、多层感知形状解码器和CNN纹理解码器的参数;

将获取的2D人脸图像输入训练好的非线性3DMM模型,得到3D人脸;

其中,2D人脸图像经过所述CNN编码器估计得到形状参数和纹理参数,所述多层感知形状解码器将所述形状参数解码为3D形状,所述CNN纹理解码器将所述纹理参数解码为3D纹理,所述渲染层根据所述3D形状、3D纹理和预定义的2D纹理图进行3D渲染,得到3D人脸。

2.根据权利要求1所述的非线性3DMM人脸重建方法,其特征在于,所述非线性3DMM模型的训练包括先后进行的预训练阶段和微调阶段,其中:

所述预训练阶段的损失函数L0为:

L0=λ1L1+L23L34L4

L1为关键点损失,L2为3D形状损失,L3为3D纹理损失,L4为投影参数损失;

所述微调阶段的损失函数L为:

L=L65L51L1

L5为对抗损失,在对抗损失中,生成器为所述非线性3DMM模型,判别器为patchGAN的判别器;L6为重建损失;

X(i,j)为渲染图像在坐标(i,j)处的值,Y(i,j)为2D人脸图像在坐标(i,j)处的值,H、W分别为2D人脸图像的高度和宽度;

λ1~λ5为定义的系数。

3.根据权利要求1或2所述的非线性3DMM人脸重建方法,其特征在于,所述CNN编码器包括依次连接的14个卷积层、AvgPool层和全连接层,所述CNN编码器在所述AvgPool层输出形状参数和纹理参数;所述CNN纹理解码器包括依次连接的全连接层、14个卷积层,所述CNN纹理解码器在最后一个卷积层输出3D纹理;所述多层感知形状解码器包括两个全连接层。

4.根据权利要求3所述的非线性3DMM人脸重建方法,其特征在于,所述渲染层根据所述3D形状、3D纹理和预定义的2D纹理图进行3D渲染,得到3D人脸,包括:

预定义2D纹理图,所述2D纹理图每个像素点与3D形状的顶点相对应;

通过2D纹理图中每个像素点纹理值确定3D形状中每个顶点的纹理值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京眼神智能科技有限公司;北京眼神科技有限公司,未经北京眼神智能科技有限公司;北京眼神科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910820065.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code