[发明专利]视频生成方法、装置、设备及存储介质在审

申请号：	202111566280.9	申请日：	2021-12-20
公开（公告）号：	CN114283060A	公开（公告）日：	2022-04-05
发明（设计）人：	张英杰;张启军;朱亦凡;张清源	申请（专利权）人：	北京字节跳动网络技术有限公司
主分类号：	G06T3/40	分类号：	G06T3/40;G06T5/50;G06T7/62;G06T7/64
代理公司：	北京远智汇知识产权代理有限公司 11659	代理人：	范坤坤
地址：	100041 北京市石景山区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频生成方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开实施例公开了一种视频生成方法、装置、设备及存储介质。提取原始图像的第一特征信息和原始驱动视频中各视频帧的第二特征信息；其中，所述原始图像和所述原始驱动视频均包含人物形象；根据所述第一特征信息和各所述第二特征信息获取多个光流变换信息；根据所述第一特征信息和所述多个光流变换信息对所述原始图像进行变换处理，获得多个目标图像；将所述多个目标图像进行拼接，获得目标视频。本公开实施例提供的视频生成方法，基于第一特征信息和原始驱动视频对应的多个光流变换信息对原始图像进行变换处理，实现了将原始驱动视频中的人物表情转移至原始图像中的人物中，不仅可以提高表情驱动视频的生成效率，也提高了生成视频的趣味性。

技术领域

本公开实施例涉及图像处理技术领域，尤其涉及一种视频生成方法、装置、设备及存储介质。

背景技术

随着人工智能技术的不断发展，深度神经网络已经在计算机视觉、自然语言处理和其他跨学科研究领域日益普及。表情驱动技术就是以深度神经网络为基础的一项重要计算机视觉运用，该技术可以通过输入一张目标图像和相应的驱动视频，将驱动视频中的运动轨迹转移到目标图像上，生成以目标图像为基准带有驱动视频运动轨迹的视频。

现有的表情驱动技术因为模型计算量巨大以及传统计算设备计算机不足、存储量不够的原因，很难做到实时处理，因此需要额外的计算和存储设备进行异构加速，但由于现有技术的计算过程限制，传统的异构计算方案面临着额外的数据传输，导致如下两个问题：

1、额外的传输时间导致无法实时进行表情驱动视频生成。

2、额外的数据存储开销过大导致单卡设备面临着存储空间不足的问题。

发明内容

本公开实施例提供一种视频生成方法、装置、设备及存储介质，可以提高表情驱动视频的生成效率。

第一方面，本公开实施例提供了一种视频生成方法，包括：

提取原始图像的第一特征信息和原始驱动视频中各视频帧的第二特征信息；其中，所述原始图像和所述原始驱动视频均包含人物形象；

根据所述第一特征信息和各所述第二特征信息获取多个光流变换信息；