[发明专利]视频剪辑方法、装置、计算机设备及存储介质有效
申请号: | 202111342772.X | 申请日: | 2021-11-12 |
公开(公告)号: | CN114339392B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 冯鑫 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/845;H04N21/81;G06V20/40;G06V10/82 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李文静 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频剪辑 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例公开了一种视频剪辑方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:对第一视频数据中的音频数据进行音乐识别,得到音频数据中的每个音频帧对应的识别结果;基于每个音频帧对应的识别结果,确定音频数据中的音乐片段;从第一视频数据中,截取与音乐片段的播放时间段相同的视频片段,得到包括音乐片段的第二视频数据。通过对视频数据中的音频数据进行音乐识别,来确定音频数据中的音乐片段,并根据该音乐片段在视频数据中的出现位置,来自动定位视频数据中包括音乐的视频片段,从而将包括音乐的视频片段从视频数据中截取下来,实现了视频剪辑的自动化流程,提高了视频剪辑的效率。
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种视频剪辑方法、装置、计算机设备及存储介质。
背景技术
在人们的日常生活中,视频剪辑功能的应用越来越广泛,视频剪辑是指从视频数据中截取一部分视频片段,将所截取的视频片段构成新的视频数据。在相关技术中,通常需要人工截取视频数据中的视频片段,会耗费较多时间,因此视频剪辑的效率比较低。
发明内容
本申请实施例提供了一种视频剪辑方法、装置、计算机设备及存储介质,能够提高视频剪辑的效率。所述技术方案如下:
一方面,提供了一种视频剪辑方法,所述方法包括:
对第一视频数据中的音频数据进行音乐识别,得到所述音频数据中的每个音频帧对应的识别结果,所述识别结果表示所述音频帧是否属于音乐音频帧;
基于每个所述音频帧对应的识别结果,确定所述音频数据中的音乐片段,所述音乐片段包括多个音乐音频帧;
从所述第一视频数据中,截取与所述音乐片段的播放时间段相同的视频片段,得到包括所述音乐片段的第二视频数据。
可选地,所述特征识别子模型包括特征变换网络和分类网络,所述调用所述特征识别子模型,基于多个所述音频帧的音频特征进行特征识别,得到每个所述音频帧对应的识别结果,包括:
调用所述特征变换网络,基于多个所述音频帧的音频特征进行特征变换,得到每个所述音频帧的关联特征,所述音频帧的关联特征表示所述音频帧与前序音频帧和后序音频帧之间的关联关系;
调用所述分类网络,基于每个所述音频帧的关联特征进行分类,得到每个所述音频帧对应的识别结果。
可选地,所述音乐识别模型的训练过程,包括:
获取样本音频数据以及所述样本音频数据中的每个样本音频帧对应的样本识别结果,所述样本识别结果表示所述样本音频帧是否属于音乐音频帧;
调用所述频谱提取子模型,提取每个所述样本音频帧的样本频谱信息;
调用所述特征提取子模型,分别基于每个所述样本音频帧的样本频谱信息进行特征提取,得到每个所述样本音频帧的样本音频特征;
调用所述特征识别子模型,基于多个所述样本音频帧的样本音频特征进行特征识别,得到每个所述样本音频帧对应的预测识别结果;
基于每个所述样本音频帧对应的所述预测识别结果与所述样本识别结果,训练所述音乐识别模型。
可选地,所述音频帧对应的识别结果为分类数值,所述分类数值表示所述音频帧属于音乐音频帧的可能性;所述基于每个所述音频帧对应的识别结果,确定所述音频数据中的音乐片段,包括:
在所述音频帧的分类数值大于分类阈值的情况下,将所述音频帧确定为音乐音频帧;
将所述音频数据中连续的多个音乐音频帧构成所述音乐片段。
另一方面,提供了一种视频剪辑方法,所述方法包括:
显示第一视频数据的剪辑选项;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111342772.X/2.html,转载请声明来源钻瓜专利网。