[发明专利]视频的生成方法、装置、电子设备及可读存储介质在审
申请号: | 202010088384.2 | 申请日: | 2020-02-12 |
公开(公告)号: | CN111368137A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 彭哲;鲍冠伯;刘玉强 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/738 | 分类号: | G06F16/738;G06F16/783;G06K9/62 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 电子设备 可读 存储 介质 | ||
本申请公开了一种视频的生成方法、装置、电子设备及可读存储介质,涉及计算机视觉技术。具体实现方案为获取待生成视频中目标对象的脸部图像的三维脸部网格和所述脸部图像的脸部图像纹理;根据所述目标对象的音频内容的音频特征,获得所述脸部图像的各表情参数;根据所述脸部图像的三维脸部网格、所述脸部图像的各表情参数和所述脸部图像的脸部图像纹理,获得所述三维脸部网格的各渲染脸部图像;对所述三维人脸网格的各渲染人脸图像和模板视频的各视频帧图像进行融合处理,以获得融合之后的各融合视频帧图像;以及对所述各融合视频帧图像进行合成处理,以生成融合视频。
技术领域
涉及计算机技术,具体涉及计算机视觉技术,尤其涉及一种视频的生成方法、装置、电子设备及可读存储介质。
背景技术
随着互联网的深入发展,终端能够集成越来越多的功能,从而使得应用于终端上的应用(Application,APP)层出不穷。有些应用中会涉及视频的内容表达,通常可以采用人工方式,进行视频的录制,以生成具有各种内容表达的视频。
然而,由于完全依赖人工录制,使得视频生成的效率较低。尤其是对于一些具有固定内容表达的视频,例如新闻播报、学科教学等内容表达的视频,这些视频所表达的内容是固定的,完全采用人工录制的方式,不但效率特别地,而且还会造成不必要的人力资源的浪费。
发明内容
本申请的多个方面提供一种视频的生成方法、装置、电子设备及可读存储介质,用以提高视频生成的效率。
本申请的一方面,提供一种视频的生成方法,包括:
获取待生成视频中目标对象的脸部图像的三维脸部网格和所述脸部图像的脸部图像纹理;
根据所述目标对象的音频内容的音频特征,获得所述脸部图像的各表情参数;
根据所述脸部图像的三维脸部网格、所述脸部图像的各表情参数和所述脸部图像的脸部图像纹理,获得所述三维脸部网格的各渲染脸部图像;
对所述三维人脸网格的各渲染人脸图像和模板视频的各视频帧图像进行融合处理,以获得融合之后的各融合视频帧图像;
对所述各融合视频帧图像进行合成处理,以生成融合视频。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取待生成视频中目标对象的脸部图像的三维脸部网格和所述脸部图像的脸部图像纹理,包括:
根据所述目标对象的图像内容,获得所述脸部图像的三维脸部网格;
根据所述脸部图像的三维脸部网格与所述目标对象的图像内容的投影关系,获得所述脸部图像的脸部图像纹理。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述目标对象的图像内容,获得所述脸部图像的三维脸部网格,包括:
根据所述目标对象的图像内容,获得所述目标对象的图像特征信息;以及根据所述目标对象的图像特征信息,利用预先训练的第一神经网络,获得所述脸部图像的三维脸部网格;或者
根据所述目标对象的图像内容,利用预先训练的第二神经网络,获得所述脸部图像的三维脸部网格;或者
利用人工标定关键点,对所述目标对象的图像内容进行建模处理,以获得所述脸部图像的三维脸部网格。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述目标对象的图像特征信息,利用预先训练的第一神经网络,获得所述脸部图像的三维脸部网格,包括:
根据所述目标对象的图像特征信息,利用预先训练的第一神经网络,获得所述脸部图像的各形状参数;
根据所述脸部图像的各形状参数,获得所述脸部图像的三维脸部网格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010088384.2/2.html,转载请声明来源钻瓜专利网。