[发明专利]基于视频时序的人脸年龄编辑方法在审
申请号: | 202211389219.6 | 申请日: | 2022-11-08 |
公开(公告)号: | CN115761048A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 张宁;金志威;张雅滋 | 申请(专利权)人: | 北京中科睿鉴科技有限公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06V40/16;G06V10/24;G06V10/26;G06V10/82;G06N3/045;G06N3/0475;G06N3/094 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 沈敏强 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 时序 年龄 编辑 方法 | ||
1.一种基于视频时序的人脸年龄编辑方法,其特征在于:
获取包含人脸的待编辑视频和待编辑年龄信息;
从待编辑视频的视频帧中裁剪出人脸图像,将人脸图像经仿射变换得到对齐后的人脸图像;
通过映射网络从待编辑视频第i帧图像的对齐后的人脸图像中获取人脸特征编码;
基于待编辑年龄信息从人脸年龄特征分类库中获取该待编辑年龄信息对应的人脸年龄特征编码;
将第i-1帧、第i帧和第i+1帧图像各自的人脸特征编码和人脸年龄特征编码结合后分别输入经训练的生成器,配合权重微调损失函数Lpt微调生成器权重参数;
其中,xi为第i帧的人脸图像;为第i帧图像输入经训练的生成器所生成人脸图像;λ为超参数;N表示图像数量;LLPIPS表示学习感知图片相似度损失函数;LL2表示欧式距离损失函数;
将第i帧图像的人脸特征编码和人脸年龄特征编码结合后输入经微调权重的生成器,得到第i帧图像中人脸图像的人脸年龄编辑后图像;
将人脸年龄编辑后图像经仿射逆变换后贴合到第i帧图像中,得到人脸年龄编辑后的视频帧;
基于人脸年龄编辑后的视频帧生成人脸年龄编辑后的视频。
2.根据权利要求1所述的基于视频时序的人脸年龄编辑方法,其特征在于,在将人脸年龄编辑后图像经仿射逆变换后贴合到第i帧图像中之前,还包括:
将人脸年龄编辑后图像输入经训练的人脸语义分割网络进行分割,得到语义分割后的人脸年龄编辑后图像。
3.根据权利要求2所述的基于视频时序的人脸年龄编辑方法,其特征在于:所述人脸语义分割网络先通过8个下采样层进行人脸特征提取,得到热度图,然后再通过8个上采样层对得到的热度图进行放大,放大到与输入图片同样大小,最终对每个像素进行分类。
4.根据权利要求3所述的基于视频时序的人脸年龄编辑方法,其特征在于,所述人脸语义分割网络训练过程中采用的损失函数如下:
其中,yi表示第i个真实目标值,是人脸像素为1,非人脸像素为0;xi为第i帧图像的人脸年龄编辑后图像;w*为人脸语义分割网络的参数;b为人脸语义分割网络的偏置。
5.根据权利要求1所述的基于视频时序的人脸年龄编辑方法,其特征在于,所述将第i-1帧、第i帧和第i+1帧图像各自的人脸特征编码和人脸年龄特征编码结合后分别输入经训练的生成器,配合权重微调损失函数Lpt微调生成器权重参数,包括:
当第i帧为待编辑视频的第1帧时,将第1帧、第1帧和第2帧三张图像各自的人脸特征编码和人脸年龄特征编码结合后分别输入经训练的生成器;
当第i帧为待编辑视频的最后一帧时,将前一帧、最后一帧和最后一帧三张图像各自的人脸特征编码和人脸年龄特征编码结合后分别输入经训练的生成器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科睿鉴科技有限公司,未经北京中科睿鉴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211389219.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双8字形磁耦合线圈及磁耦合机构
- 下一篇:镜面水波纹检测装置