[发明专利]模型生成方法、音频处理方法、装置、终端及存储介质在审
申请号: | 201910134014.5 | 申请日: | 2019-02-22 |
公开(公告)号: | CN109977255A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 贾少勇 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/635 | 分类号: | G06F16/635;G06F16/65 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 样本音频 音乐风格 预设 模型生成 音频数据段 特征向量 音频处理 音频样本 标签 训练集 计算机可读存储介质 终端 目标音频数据 存储介质 样本集 维度 切割 样本 更新 学习 | ||
本发明实施例提供了一种模型生成方法、音频处理方法、装置、终端及计算机可读存储介质,所述模型生成方法包括:根据预设音乐风格标签对样本音频数据进行标注,生成标注音频样本;将所述标注音频样本切割为预设长度的多个标注音频数据段;将各所述标注音频数据段处理为多个预设维度的标注样本音频段特征向量,以作为标注样本集;将所述标注样本集中各所述标注样本音频段特征向量的所述预设音乐风格标签进行更新,得到标注样本音频训练集;利用深度学习方法对所述标注样本音频训练集进行训练,得到第一音乐风格标注模型。实现了将目标音频数据输入第一音乐风格标注模型,得到音乐风格标签的目的。
技术领域
本发明涉及网络技术领域,特别是涉及模型生成方法、音频处理方法、终端及计算机可读存储介质。
背景技术
随着视频或音频网络的普及和发展,涌现出很多视频及音频网站,方便用户在视频或音频网站上搜索感兴趣的视频或音频,极大的丰富了用户的生活。
目前,针对视频或音频网站上存储的大量由用户自制或者官方制作的音视频数据供用户使用,其中,针对音视频数据的音乐风格向用户推荐音视频的功能具备极大的需求。然而,现有技术中,往往通过人工进行音视频网站的音乐风格标注,效率低且成本高。
因此,如何高效准确的对音视频网站上存储的音视频数据进行音乐风格的标注是目前有待解决的技术问题。
发明内容
本发明实施例所要解决的技术问题是提供一种模型生成方法、音频处理方法、装置、终端及计算机可读存储介质,以解决对视频网站上存储的音乐相关视频数据或音频数据进行音乐风格的标注的技术问题。
为了解决上述问题,本发明是通过如下技术方案实现的:
第一方面提供一种模型生成方法,所述方法包括:
根据预设音乐风格标签对样本音频数据进行标注,生成标注音频样本;
将所述标注音频样本切割为预设长度的多个标注音频数据段;
将各所述标注音频数据段处理为多个预设维度的标注样本音频段特征向量,以作为标注样本集;
将所述标注样本集中各所述标注样本音频段特征向量的所述预设音乐风格标签进行更新,得到标注样本音频训练集;
利用深度学习方法对所述标注样本音频训练集进行训练,得到第一音乐风格标注模型。
第二方面提供一种音频处理方法,所述方法包括:
接收对目标音频数据进行音乐风格的标注请求;
根据所述标记请求,利用音乐风格标注模型,标记所述目标音频数据的音乐风格。
第三方面提供一种模型生成装置,所述装置包括:
标注音频样本生成模块,用于根据预设音乐风格标签对样本音频数据进行标注,生成标注音频样本;
标注音频数据段获取模块,用于将所述标注音频样本切割为预设长度的多个标注音频数据段;
标注样本集确定模块,用于将各所述标注音频数据段处理为多个预设维度的标注样本音频段特征向量,以作为标注样本集;
标注样本音频训练集生成模块,用于将所述标注样本集中各所述标注样本音频段特征向量的所述预设音乐风格标签进行更新,得到标注样本音频训练集;
第一音乐风格标注模型训练模块,用于利用深度学习方法对所述标注样本音频训练集进行训练,得到第一音乐风格标注模型。
第四方面提供一种音频处理装置,所述装置包括:
音乐风格标注请求接收模块,用于接收对目标音频数据进行音乐风格的标注请求;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910134014.5/2.html,转载请声明来源钻瓜专利网。