[发明专利]视频处理方法、装置、电子设备和存储介质有效
申请号: | 202010602733.8 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111918094B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 薛学通;任晖;杨敏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/233;H04N21/44;H04N21/439;G06F16/432 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 处理 方法 装置 电子设备 存储 介质 | ||
1.一种视频处理方法,其中,包括:
获取源视频的第一特征信息;
获取每个候选音乐素材的第二特征信息;
将所述第一特征信息输入目标度量学习模型进行度量学习,以获取在特征空间内所述源视频的第一特征表示,所述目标度量学习模型是预先训练得到的;
将所述第二特征信息输入所述目标度量学习模型进行度量学习,以获取在所述特征空间内所述候选音乐素材的第二特征表示;
获取所述第一特征表示和所述第二特征表示之间的相似度,作为所述源视频与所述候选音乐素材的所述相似度;
根据每个所述候选音乐素材对应的所述相似度,从多个所述候选音乐素材中选取目标音乐素材;以及
在所述源视频中加载所述目标音乐素材,以生成目标视频;
所述方法还包括:
选取样本数据,其中所述样本数据中包括样本视频和与所述样本视频匹配的背景音乐;
从所述样本数据中分离出所述样本视频和所述背景音乐;
将所述样本视频输入视频通道中进行特征提取,以获取第三特征信息;以及
将所述背景音乐输入音频通道中进行特征提取,以获取第四特征信息;
利用所述第三特征信息和所述第四特征信息,对度量学习模型进行训练,以生成目标度量学习模型,其中,所述目标度量学习模型用于对所述第一特征信息和所述第二特征信息进行度量学习;
其中,所述获取源视频的第一特征信息,包括:
对所述源视频进行特征提取,以获取所述源视频的图像特征;
对所述源视频进行实体识别,以获取所述源视频的第一实体关键词;
获取所述第一实体关键词的第一词向量;以及
将所述图像特征和所述第一词向量进行拼接,以获取所述第一特征信息;
其中,所述获取每个候选音乐素材的第二特征信息,包括:
对所述候选音乐素材进行特征提取,以获取所述候选音乐素材的音频特征;
对所述候选音乐素材进行语音信息识别,以获取所述候选音乐素材的第二实体关键词;
获取所述第二实体关键词的第二词向量;以及
将所述音频特征和所述第二词向量进行拼接,以获取所述第二特征信息。
2.根据权利要求1所述的视频处理方法,其中,所述选取样本数据,包括:
获取候选样本视频和所述候选样本视频的描述信息;以及
根据所述描述信息从所述候选样本视频中筛选出所述样本视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010602733.8/1.html,转载请声明来源钻瓜专利网。