[发明专利]视频生成方法和装置、计算机可读存储介质、电子设备在审
申请号: | 202110438622.2 | 申请日: | 2021-04-22 |
公开(公告)号: | CN113132815A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 赵靖 | 申请(专利权)人: | 北京房江湖科技有限公司 |
主分类号: | H04N21/81 | 分类号: | H04N21/81;G06T17/00 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 王晓多 |
地址: | 101300 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 计算机 可读 存储 介质 电子设备 | ||
1.一种视频生成方法,其特征在于,包括:
基于目标对象的第一人脸图像,得到第一三维人头模型;其中,所述第一三维人头模型包括多个顶点和顶点之间的连接关系;
基于目标语音数据改变所述第一三维人头模型中n个顶点的位置,得到多帧视频图像;其中,n为大于等于0的整数;
基于所述多帧视频图像,得到所述目标对象讲述所述目标语音数据的目标视频。
2.根据权利要求1所述的方法,其特征在于,所述基于目标对象的第一人脸图像,得到第一三维人头模型,包括:
利用第一重建模型对所述第一人脸图像进行人头模型恢复,得到所述第一三维人头模型;其中,所述第一重建模型经过训练。
3.根据权利要求2所述的方法,其特征在于,在利用第一重建模型对所述第一人脸图像进行人头模型恢复,得到所述第一三维人头模型之前,还包括:
基于第一样本数据集对所述第一重建模型进行训练;其中,所述第一样本数据集包括多对第一样本数据对,每对所述第一样本数据对包括对应的样本人脸图像和样本三维人头模型。
4.根据权利要求1-3任一所述的方法,其特征在于,所述基于目标语音数据改变所述第一三维人头模型中n个顶点的位置,得到多帧视频图像,包括:
对所述目标语音数据进行切分处理,得到多个语音片段;
基于所述多个语音片段分别改变多个所述第一三维人头模型中每个第一三维人头模型中n个顶点的位置,得到多个第二三维人头模型;其中,每个所述语音片段对应一个所述第一三维人头模型;
基于所述多个第二三维人头模型得到多帧视频图像。
5.根据权利要求4所述的方法,其特征在于,所述基于所述多个语音片段分别改变多个所述第一三维人头模型中每个第一三维人头模型中n个顶点的位置,得到多个第二三维人头模型,包括:
基于所述多个语音片段和多个第一三维人头模型得到多组输入数据;其中,每组所述输入数据包括一个语音片段和对应的所述第一三维人头模型;
基于语音驱动模型分别对每组所述输入数据进行处理,得到多个所述第二三维人头模型;其中,所述第二三维人头模型与所述第一三维人头模型的区别在于部分顶点位置不同。
6.根据权利要求4或5所述的方法,其特征在于,所述基于所述多个第二三维人头模型得到多帧视频图像,包括:
分别对所述多个第二三维人头模型中的每个第二三维人头模型进行渲染,得到多帧所述视频图像。
7.根据权利要求1-6任一所述的方法,其特征在于,所述基于所述多帧视频图像,得到所述目标对象讲述所述目标语音数据的目标视频,包括:
将所述多帧视频图像按照对应的语音片段在所述目标语音数据中的顺序进行连接,得到所述目标对象讲述所述目标语音数据的目标视频。
8.一种视频生成装置,其特征在于,包括:
模型恢复模块,用于基于目标对象的第一人脸图像,得到第一三维人头模型;其中,所述第一三维人头模型包括多个顶点和顶点之间的连接关系;
模型驱动模块,用于基于目标语音数据改变所述第一三维人头模型中n个顶点的位置,得到多帧视频图像;其中,n为大于等于0的整数;
视频生成模块,用于基于所述多帧视频图像,得到所述目标对象讲述所述目标语音数据的目标视频。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一所述的视频生成方法。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7任一所述的视频生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京房江湖科技有限公司,未经北京房江湖科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110438622.2/1.html,转载请声明来源钻瓜专利网。