[发明专利]基于单张人脸图像的实时全自动高质量三维人脸重建方法有效

申请号：	201710581769.0	申请日：	2017-07-17
公开（公告）号：	CN107358648B	公开（公告）日：	2019-08-27
发明（设计）人：	张举勇;郭玉东	申请（专利权）人：	中国科学技术大学
主分类号：	G06T17/00	分类号：	G06T17/00;G06N3/08
代理公司：	北京凯特来知识产权代理有限公司 11260	代理人：	郑立明;郑哲
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	集合人脸图像数据人脸图像神经网络模型三维偏移人脸重建参数化模型人脸图片像素点渲染人脸区域拟合光滑耗时表情优化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于单张人脸图像的实时全自动高质量三维人脸重建方法，其特征在于，包括：

对初始的人脸图像数据集合，拟合其参数化模型系数与人脸区域每个像素点沿着深度方向的偏移，得到人脸图像数据集合T；

改变人脸图像数据集合T中的表情和姿态系数后，渲染人脸图片，得到光滑的人脸图像数据集合C；改变人脸图像数据集合T中的偏移后，渲染人脸图片，得到带细节的人脸图像数据集合F；

利用光滑的人脸图像数据集合C训练深度神经网络模型CoarseNet，并利用带细节的人脸图像数据集合F训练深度神经网络模型FineNet；

利用训练好的深度神经网络模型CoarseNet和FineNet，对输入的单张人脸图像进行处理，得到参数化模型系数以及像素点沿着深度方向的偏移，从而重建出三维人脸；

所述对初始的人脸图像数据集合，拟合其参数化模型系数与人脸区域每个像素点沿着深度方向的偏移包括：

利用人脸颜色信息对参数化模型系数χ进行拟合：

E(x)＝E_con+w_lanE_lan+w_regE_reg

上式中，E_con为颜色项衡量由渲染的图片和实际图片的差异；E_lan为关键点约束，使三维点的投影和图像上检测到的关键点尽可能接近；E_reg是正则项，以保证参数化模型系数χ中的身份α_id、表情α_exp及纹理α_alb系数在合理的范围内；w_lan和w_reg分别是E_lan和E_reg相对于E_con的权重；

具体的：

其中，C_S是由χ渲染的图片，C_I是输入的图片，P是所有像素的集合；

其中，是关键点的集合，i为关键点的序号，f_i为图像平面的二维关键点，为投影矩阵，其中的s为比例系数，V_i为网格上的三维关键点，为平移向量，R为旋转矩阵；

其中，σ为对应的主成分方向的标准差，J为身份与纹理的PCA维数，K为表情的PCA维数；α_id,j、α_alb,j分别为第j个分量的身份、纹理系数；σ_id,j、σ_alb,j分别为第j个分量的身份、纹理系数对应主成分方向的标准差；α_exp,k为第k个分量的表情系数，σ_exp,k为第k个分量的表情系数对应主成分方向的标准差；

利用人脸颜色信息对人脸区域每个像素点沿着深度方向的偏移进行拟合，假设所有像素偏移构成向量d，则拟合方式如下：

其中，为正则项，使d接近0；μ₂||Ld||₁为光滑约束项，Ld表示偏移的拉普拉斯，μ₁和μ₂分别是和||Ld||₁相对于E_con的权重。

2.根据权利要求1所述的一种基于单张人脸图像的实时全自动高质量三维人脸重建方法，其特征在于，所述人脸图像数据集合T中包括：若干彩色人脸图像以及对应的标签；

每一彩色人脸图像均为RGB三通道图像；标签分为两部分，一部分为参数化模型系数，包括身份、表情、纹理、光照以及姿态系数；另一部分为人脸区域每个像素点沿着深度方向的偏移。

3.根据权利要求1所述的一种基于单张人脸图像的实时全自动高质量三维人脸重建方法，其特征在于，所述光滑的人脸图像数据集合C中包括：若干彩色人脸图像以及对应的标签；

每一彩色人脸图像均为RGB三通道图像；标签是参数化模型系数，包括身份、表情以及姿态系数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学，未经中国科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710581769.0/1.html，转载请声明来源钻瓜专利网。