[发明专利]视频配乐方法、装置、电子设备及计算机可读介质有效
申请号: | 202010506355.3 | 申请日: | 2020-06-05 |
公开(公告)号: | CN111800650B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 刘恩雨;李松南;尚焱;刘杉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/2343;H04N21/233 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 配乐 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种视频配乐方法,其特征在于,包括:
获取目标视频;
通过第二深度学习模型对所述目标视频进行内容提取,获得所述目标视频的内容描述文本,所述内容描述文本包括主体信息和行为信息,所述主体信息的主体类别包括第一主体类别和第二主体类别;
通过第一深度学习模型根据所述内容描述文本确定所述目标视频的情感信息,并确定所述情感信息的情感类别,所述情感类别包括第一情感类别和第二情感类别;
若所述情感类别为所述第一情感类别,则从旋律音调标签与所述第一情感类别匹配的第一音乐集合中确定所述目标视频的目标音频;
若所述情感类别为所述第二情感类别,且所述主体类别为所述第一主体类别,则从歌词标签与所述第一主体类别匹配的第二音乐集合中确定所述目标视频的目标音频;
若所述情感类别为所述第二情感类别,且所述主体类别为所述第二主体类别,则从节奏标签与所述行为信息匹配的第三音乐集合中确定所述目标视频的目标音频;
合成所述目标音频与所述目标视频。
2.如权利要求1所述的方法,其特征在于,通过第一深度学习模型根据所述内容描述文本确定所述目标视频的情感信息包括:
通过第一深度学习模型对所述内容描述文本进行处理,获得所述目标视频的情感信息向量;
将所述情感信息向量中分值大于预设分数阈值的标签确定为所述目标视频的所述情感信息。
3.如权利要求1所述的方法,其特征在于,对所述目标视频进行内容提取,获得所述目标视频的内容描述文本包括:
通过第二深度学习模型对所述目标视频进行处理,获得所述目标视频的内容描述文本。
4.如权利要求1所述的方法,其特征在于,合成所述目标音频与所述目标视频包括:
按照所述目标视频的视频时长对所述目标音频进行截取或拼接;
合成所述目标视频与截取或拼接后的所述目标音频。
5.一种视频配乐装置,其特征在于,包括:
视频获取模块,配置为获取目标视频;
内容提取模块,配置为通过第二深度学习模型对所述目标视频进行内容提取,获得所述目标视频的内容描述文本,所述内容描述文本包括主体信息和行为信息,所述主体信息的主体类别包括第一主体类别和第二主体类别;
音频匹配模块,配置为通过第一深度学习模型根据所述内容描述文本确定所述目标视频的情感信息,并确定所述情感信息的情感类别,所述情感类别包括第一情感类别和第二情感类别;
若所述情感类别为所述第一情感类别,则从旋律音调标签与所述第一情感类别匹配的第一音乐集合中确定所述目标视频的目标音频;
若所述情感类别为所述第二情感类别,且所述主体类别为所述第一主体类别,则从歌词标签与所述第一主体类别匹配的第二音乐集合中确定所述目标视频的目标音频;以及
若所述情感类别为所述第二情感类别,且所述主体类别为所述第二主体类别,则从节奏标签与所述行为信息匹配的第三音乐集合中确定所述目标视频的目标音频;
音视频合成模块,配置为合成所述目标音频与所述目标视频。
6.一种电子设备,其特征在于,包括:
至少一个处理器;
存储装置,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-4中任一项所述的方法。
7.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-4中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010506355.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能销
- 下一篇:一种大直径高温熔盐储罐复合式基础及其使用方法