[发明专利]一种基于正投影特征变换的俯视人脸矫正方法有效

专利信息
申请号: 201910285207.0 申请日: 2019-04-10
公开(公告)号: CN110059602B 公开(公告)日: 2022-03-15
发明(设计)人: 王中元;王南西;梁超;傅佑铭 申请(专利权)人: 武汉大学
主分类号: G06V40/16 分类号: G06V40/16;G06V20/52;G06K9/62
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 魏波
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 正投影 特征 变换 俯视 矫正 方法
【权利要求书】:

1.一种基于正投影特征变换的俯视人脸矫正方法,其特征在于,包括以下步骤:

步骤1:利用正投影特征变换网络对俯视人脸进行矫正,得到矫正后的正脸图像;

步骤1的具体实现包括以下子步骤:

步骤1.1:将俯视角度的人脸图像输入到ResNet-18网络中,对图像进行特征提取,得到不同尺度的特征图;

步骤1.2:将不同尺度的特征图,映射到3D空间中得到正交特征映射,再通过折叠体素特征产生正交平面特征;

正投影特征变换通过在投影的体素区域上累积图像特征f(u,v)来生成体素特征g(x,y,z),然后沿垂直方向折叠体素特征来产生正交平面特征h(x,z);其中,u、v是二维图像特征的坐标,x、y、z是三维体素特征的坐标;

对于给定的体素网格位置(x,y,z),每个体素被投影到图像平面的六边形区域,通过一个带有左上角(u1,v1)和右下角(u2,v2)的矩形边界框来估计,由下式给出:

其中,每个体素是尺寸为r的立方体,f是摄像机焦距,(cu,cv)是原点;

然后,通过对投影体素边界框的平均汇集,将特征分配给体素特征映射g中的适当位置:

进而将3D体素特征图折叠回二维平面特征图h(x,z);先学习一组权重矩阵W(y),然后沿垂直轴对体素特征加权求和获得平面特征图:

其中,y0为相机到地面距离,H为图像的高度;

步骤1.3:通过由一系列ResNet单元组成的自顶向下网络,对正投影特征变换后的平面特征图进行处理,将网络最后一层的输出设置为3通道输出,生成RGB图像,得到矫正后的正脸图片;

步骤2:将矫正后的正脸图像与真实正脸进行对抗训练,优化正投影特征变换网络,最终产生更精确的正面人脸图像;

步骤2的具体实现包括以下子步骤:

步骤2.1:引入鉴别器D来区分真实正面图像与步骤1中的“矫正后的正脸图像”;

步骤2.2:利用步骤1中的“矫正后的正脸图像”和真实正面图像进行训练,设置合理阈值,若步骤1中的“矫正后的正脸图像”与真实图像的差大于阈值,则反向传播调节正投影特征变换网络参数;其中,参数包括ResNet单元的权重和偏置,调节方法采用深度学习的随机梯度下降方法;

步骤2.3:重复步骤2.2,迭代优化正投影特征变换网络的参数,直到训练过程收敛,最终产生更精确的正面人脸图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910285207.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top