[发明专利]视频生成方法、装置、电子设备及可读存储介质在审
申请号: | 202111672927.6 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114520931A | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 薛愉凡;贺杰;袁野;李晓杰;高岳 | 申请(专利权)人: | 脸萌有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/439;H04N21/472;H04N21/845;G06V20/40 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 唐博 |
地址: | 英属开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 电子设备 可读 存储 介质 | ||
1.一种视频生成方法,其特征在于,包括:
从原始视频素材集合中获取多个视频素材;所述原始视频素材集合包括用户相关的视频;
获取用作背景音乐的目标音频素材;
针对各所述视频素材,对所述视频素材的各视频帧分别进行图像特征提取,根据各所述视频素材的各所述视频帧分别对应的图像特征信息进行分段处理,获得所述视频素材对应的目标视频片段;
将各所述视频素材分别对应的目标视频片段以及所述目标音频素材进行聚合,生成目标视频;所述目标视频包括多个视频片段,所述多个视频片段是分别基于多个目标视频片段得到的,所述目标视频中多个所述视频片段按照发布时间顺序播放,且所述多个视频片段的时长与所述目标音频素材中相应乐句的时长匹配。
2.根据权利要求1所述的方法,其特征在于,所述获取用作背景音乐的目标音频素材,包括:
根据预设音频素材集合中各音频素材的音频特征、音频素材的节拍信息以及音频素材中特定音频片段的各乐句的时长,从所述预设音频素材集合中确定目标音频素材,其中,所述目标音频素材中的特定音频片段为所述目标视频的背景音乐。
3.根据权利要求2所述的方法,其特征在于,所述根据预设音频素材集合中各音频素材的音频特征、音频素材的节拍信息以及音频素材中特定音频片段的各乐句的时长,从所述预设音频素材集合中确定目标音频素材,包括:
根据预设音乐特征集合对预设音乐素材集合包括的多个音乐素材进行排除,获得第一候选音频素材集合;
根据预设音频节拍,对所述第一候选音频素材集合包括的各音频素材进行排除,获得第二候选音频素材集合;
根据所述第二候选音频素材集合中,特定音频片段包括的各乐句时长满足预设时长条件的音频素材,确定所述目标音频素材。
4.根据权利要求3所述的方法,其特征在于,若所述第二候选音频素材集合中不存在特定音频片段中乐句时长满足预设时长条件的音频素材,则所述方法还包括:
根据所述用户的偏好与预先指定的音频素材集合中各音频素材分别对应的音频特征进行匹配,若匹配成功,则根据匹配成功的音频素材确定所述目标音频素材。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对各所述视频素材,根据所述视频素材的各所述视频帧分别对应的图像特征信息进行加权计算,获得各所述视频帧分别对应的评价结果;
根据各所述视频帧分别对应的评价结果,从所述视频素材的各所述视频帧中抽取目标视频帧,以获得视频帧集合,所述视频帧集合包括从所述多个视频素材中抽取的多个目标视频帧,所述视频帧集合用于生成所述目标视频的片头和/或片尾;
所述将各所述视频素材分别对应的目标视频片段以及所述目标音频素材进行聚合,生成目标视频,包括:
将各所述视频素材分别对应的目标视频片段、所述视频帧集合以及所述目标音频素材进行聚合,生成所述目标视频,所述目标视频包括根据所述视频帧集合生成的片头和/或片尾。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据各所述视频素材的视频帧分别对应的图像特征信息进行分段处理,获得目标视频片段,包括:
根据所述视频素材的各视频帧分别对应的图像特征信息、所述目标音频片段中相应乐句的时长以及所述视频素材中原始音频的语句切分结果,对所述视频素材进行分段处理,获得所述目标视频片段。
7.根据权利要求6所述的方法,其特征在于,所述目标音频片段包括相对应的原始音频中的一个或者多个完整语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸萌有限公司,未经脸萌有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111672927.6/1.html,转载请声明来源钻瓜专利网。