[发明专利]模型生成、视频处理方法、装置、电子设备及存储介质有效
申请号: | 201910458806.8 | 申请日: | 2019-05-29 |
公开(公告)号: | CN110324726B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 贾少勇 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | H04N21/845 | 分类号: | H04N21/845;H04N21/439;H04N21/44;H04N21/233;H04N21/234;G10L25/30;G10L25/51;G10L25/57;G06K9/62;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 生成 视频 处理 方法 装置 电子设备 存储 介质 | ||
1.一种模型生成方法,其特征在于,所述方法包括:
获取训练样本;所述训练样本包括多个属于音乐类别的样本视频及多个不属于音乐类别的样本视频和所述样本视频的标注信息;所述标注信息用于指示所述样本视频是否属于音乐类别;
将所述样本视频划分为多个单位样本视频;
针对每个单位样本视频,获取所述单位样本视频对应的音频特征向量;
随机抽取连续至少两个单位样本视频,将抽取的单位样本视频对应的音频特征向量拼接后输入初始模型,得到所述样本视频属于音乐类别的预测概率;
根据所述样本视频属于音乐类别的预测概率以及所述样本视频的标注信息,计算所述样本视频对应的损失值;
在所述损失值小于设定损失阈值时,确定训练完成,将训练完成的模型确定为视频处理模型。
2.根据权利要求1所述的方法,其特征在于,所述获取所述单位样本视频对应的音频特征向量,包括:
生成所述单位样本视频中的音频信号对应的频谱图;
将所述单位样本视频中的音频信号对应的频谱图输入预设的神经网络模型,将所述神经网络模型输出的音频特征向量确定为所述单位样本视频对应的音频特征向量。
3.根据权利要求2所述的方法,其特征在于,所述生成所述单位样本视频中的音频信号对应的频谱图,包括:
对所述单位样本视频中的音频信号进行分帧处理,得到多个音频信号帧;
对每个音频信号帧进行加窗处理及傅里叶变换处理,得到所述单位样本视频中的音频信号对应的初始频谱图;
对所述初始频谱图进行梅尔变换处理得到梅尔频谱图,将所述梅尔频谱图作为所述单位样本视频中的音频信号对应的频谱图。
4.一种视频处理方法,其特征在于,所述方法包括:
获取待处理视频;
将所述待处理视频划分为多个单位待处理视频;
针对每个单位待处理视频,获取所述单位待处理视频对应的音频特征向量;
将包含所述单位待处理视频在内的,连续至少两个单位待处理视频对应的音频特征向量输入预先生成的视频处理模型,根据所述视频处理模型的输出确定所述单位待处理视频是否属于音乐类别;其中,所述视频处理模型是利用权利要求1至3中任一项所述的方法生成的;
将属于音乐类别的单位待处理视频中,连续的单位待处理视频进行拼接,获得所述待处理视频中的音乐片段。
5.根据权利要求4所述的方法,其特征在于,所述获取所述单位待处理视频对应的音频特征向量,包括:
生成所述单位待处理视频中的音频信号对应的频谱图;
将所述单位待处理视频中的音频信号对应的频谱图输入预设的神经网络模型,将所述神经网络模型输出的音频特征向量确定为所述单位待处理视频对应的音频特征向量。
6.根据权利要求5所述的方法,其特征在于,所述生成所述单位待处理视频中的音频信号对应的频谱图,包括:
对所述单位待处理视频中的音频信号进行分帧处理,得到多个音频信号帧;
对每个音频信号帧进行加窗处理及傅里叶变换处理,得到所述单位待处理视频中的音频信号对应的初始频谱图;
对所述初始频谱图进行梅尔变换处理得到梅尔频谱图,将所述梅尔频谱图作为所述单位待处理视频中的音频信号对应的频谱图。
7.根据权利要求4所述的方法,其特征在于,所述将所述待处理视频划分为多个单位待处理视频,包括:
将所述待处理视频平均划分为多个视频片段;
分别将每个视频片段划分为多个单位待处理视频。
8.根据权利要求4所述的方法,其特征在于,所述针对每个单位待处理视频,获取所述单位待处理视频对应的音频特征向量,包括:
同时调用预设的多个进程;
针对由一个视频片段划分得到的每个单位待处理视频,利用一个进程获取所述单位待处理视频对应的音频特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910458806.8/1.html,转载请声明来源钻瓜专利网。