[发明专利]生成视频的方法、装置、存储介质及电子设备有效
申请号: | 202010899561.5 | 申请日: | 2020-08-31 |
公开(公告)号: | CN112165582B | 公开(公告)日: | 2023-02-21 |
发明(设计)人: | 王梦丽;庞芸萍;王文明 | 申请(专利权)人: | 北京小米松果电子有限公司 |
主分类号: | H04N5/262 | 分类号: | H04N5/262;H04N21/2343;H04N21/4402;G06N3/045;G06N3/049;G06N3/092 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 贺晓蕾 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 视频 方法 装置 存储 介质 电子设备 | ||
1.一种生成视频的方法,其特征在于,所述方法包括:
通过终端获取多个目标图片;
获取与多个所述目标图片对应的图片关联信息,所述图片关联信息包括所述目标图片的拍摄信息和/或图片描述信息,所述图片描述信息用于描述多个所述目标图片的语义信息;
根据多个所述目标图片和所述图片关联信息,生成所述目标图片对应的目标视频;
所述根据多个所述目标图片和所述图片关联信息,生成所述目标图片对应的目标视频包括:
根据多个所述目标图片和所述图片描述信息,通过预先训练的视频生成模型得到所述目标图片对应的目标视频;
所述视频生成模型包括第一视频生成模型和第二视频生成模型,所述根据多个所述目标图片和所述图片描述信息,通过预先训练的视频生成模型得到所述目标图片对应的目标视频包括:
将多个所述目标图片和所述图片描述信息,作为所述第一视频生成模型的输入,得到语义图片向量,所述第一视频生成模型用于将多个所述目标图片对应的图片向量和所述图片描述信息对应的信息向量相结合;
将所述语义图片向量作为所述第二视频生成模型的输入,得到所述目标视频。
2.根据权利要求1所述的方法,其特征在于,在所述将多个所述目标图片和所述图片描述信息,作为所述第一视频生成模型的输入,得到语义图片向量前,所述方法还包括:
将多个所述目标图片作为第一编码器的输入,得到图片向量;
将所述图片描述信息作为第二编码器的输入,得到信息向量;
所述将多个所述目标图片和所述图片描述信息,作为所述第一视频生成模型的输入,得到语义图片向量包括:
将所述图片向量和所述信息向量作为所述第一视频生成模型的输入,得到所述语义图片向量。
3.根据权利要求1所述的方法,其特征在于,所述第一视频生成模型通过以下方式训练得到:
通过第一训练集,对第一神经网络模型进行训练,得到所述第一视频生成模型;其中,所述第一训练集包括:多个第一样本组合,其中,每个所述第一样本组合包括:多个样本图片和多个所述样本图片的图片描述样本信息。
4.根据权利要求3所述的方法,其特征在于,所述通过第一训练集,对第一神经网络模型进行训练,得到所述第一视频生成模型包括:
针对所述第一训练集中的每个所述第一样本组合,获取多个所述样本图片对应的样本图片向量和所述图片描述样本信息对应的样本信息向量;
将所述样本图片向量和所述样本信息向量作为所述第一神经网络模型的输入,对所述第一神经网络模型进行训练,得到所述第一视频生成模型。
5.根据权利要求1所述的方法,其特征在于,所述第二视频生成模型通过以下方式训练得到:
通过第二训练集,对第二神经网络模型进行训练,得到所述第二视频生成模型;其中,所述第二训练集包括:多个样本语义图片向量,其中,所述样本语义图片向量是根据多个样本图片和多个所述样本图片的图片描述样本信息,通过所述第一视频生成模型得到。
6.根据权利要求1所述的方法,其特征在于,所述拍摄信息包括多个所述目标图片的拍摄顺序,所述根据多个所述目标图片和所述图片关联信息,生成所述目标图片对应的目标视频包括:
根据多个所述目标图片,按照所述拍摄顺序生成所述目标视频。
7.根据权利要求1所述的方法,其特征在于,所述拍摄信息包括多个所述目标图片的拍摄时间,所述根据多个所述目标图片和所述图片关联信息,生成所述目标图片对应的目标视频包括:
根据多个所述目标图片,按照所述拍摄时间的先后顺序生成所述目标视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司,未经北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010899561.5/1.html,转载请声明来源钻瓜专利网。