[发明专利]基于单张人脸图像的实时全自动高质量三维人脸重建方法有效
申请号: | 201710581769.0 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107358648B | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 张举勇;郭玉东 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06T17/00 | 分类号: | G06T17/00;G06N3/08 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集合 人脸图像数据 人脸图像 神经网络模型 三维 偏移 人脸 重建 参数化模型 人脸图片 像素点 渲染 人脸区域 拟合 光滑 耗时 表情 优化 | ||
1.一种基于单张人脸图像的实时全自动高质量三维人脸重建方法,其特征在于,包括:
对初始的人脸图像数据集合,拟合其参数化模型系数与人脸区域每个像素点沿着深度方向的偏移,得到人脸图像数据集合T;
改变人脸图像数据集合T中的表情和姿态系数后,渲染人脸图片,得到光滑的人脸图像数据集合C;改变人脸图像数据集合T中的偏移后,渲染人脸图片,得到带细节的人脸图像数据集合F;
利用光滑的人脸图像数据集合C训练深度神经网络模型CoarseNet,并利用带细节的人脸图像数据集合F训练深度神经网络模型FineNet;
利用训练好的深度神经网络模型CoarseNet和FineNet,对输入的单张人脸图像进行处理,得到参数化模型系数以及像素点沿着深度方向的偏移,从而重建出三维人脸;
所述对初始的人脸图像数据集合,拟合其参数化模型系数与人脸区域每个像素点沿着深度方向的偏移包括:
利用人脸颜色信息对参数化模型系数χ进行拟合:
E(x)=Econ+wlanElan+wregEreg
上式中,Econ为颜色项衡量由渲染的图片和实际图片的差异;Elan为关键点约束,使三维点的投影和图像上检测到的关键点尽可能接近;Ereg是正则项,以保证参数化模型系数χ中的身份αid、表情αexp及纹理αalb系数在合理的范围内;wlan和wreg分别是Elan和Ereg相对于Econ的权重;
具体的:
其中,CS是由χ渲染的图片,CI是输入的图片,P是所有像素的集合;
其中,是关键点的集合,i为关键点的序号,fi为图像平面的二维关键点,为投影矩阵,其中的s为比例系数,Vi为网格上的三维关键点,为平移向量,R为旋转矩阵;
其中,σ为对应的主成分方向的标准差,J为身份与纹理的PCA维数,K为表情的PCA维数;αid,j、αalb,j分别为第j个分量的身份、纹理系数;σid,j、σalb,j分别为第j个分量的身份、纹理系数对应主成分方向的标准差;αexp,k为第k个分量的表情系数,σexp,k为第k个分量的表情系数对应主成分方向的标准差;
利用人脸颜色信息对人脸区域每个像素点沿着深度方向的偏移进行拟合,假设所有像素偏移构成向量d,则拟合方式如下:
其中,为正则项,使d接近0;μ2||Ld||1为光滑约束项,Ld表示偏移的拉普拉斯,μ1和μ2分别是和||Ld||1相对于Econ的权重。
2.根据权利要求1所述的一种基于单张人脸图像的实时全自动高质量三维人脸重建方法,其特征在于,所述人脸图像数据集合T中包括:若干彩色人脸图像以及对应的标签;
每一彩色人脸图像均为RGB三通道图像;标签分为两部分,一部分为参数化模型系数,包括身份、表情、纹理、光照以及姿态系数;另一部分为人脸区域每个像素点沿着深度方向的偏移。
3.根据权利要求1所述的一种基于单张人脸图像的实时全自动高质量三维人脸重建方法,其特征在于,所述光滑的人脸图像数据集合C中包括:若干彩色人脸图像以及对应的标签;
每一彩色人脸图像均为RGB三通道图像;标签是参数化模型系数,包括身份、表情以及姿态系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710581769.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:脚手架扣件
- 下一篇:一种按压延迟可调的电路开关机构