[发明专利]一种纯音乐检测方法、装置及存储介质有效
申请号: | 201910398945.6 | 申请日: | 2019-05-14 |
公开(公告)号: | CN110097895B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 王征韬 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/81;G10L21/0272;G10L25/03 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纯音乐 检测 方法 装置 存储 介质 | ||
本发明实施例公开了一种纯音乐检测方法、装置及存储介质,所示方法包括:本发明实施例通过获取待检测音频;对所述待检测音频进行人声分离处理,得到待处理音频片段;然后提取所述待处理音频片段的音频特征;将所述音频特征输入训练后的人声检测网络模型中;根据所述训练后的人声检测网络模型的输出结果确定所述待处理音频片段中是否包含人声;若不包含人声,则确定所述待检测音频属于纯音乐。本发明实施例对从待检测音频中分离出来的音频片段进行纯音乐检测,不需要整曲检测,需要检测的音频长度较短,可以提高纯音乐检测的准确率。
技术领域
本发明涉及音频处理领域,具体涉及一种纯音乐检测方法、装置及存储介质。
背景技术
纯音乐是指不包含歌词的音乐,这种音乐完全以纯粹优美的音乐来叙述表达作者的情感,纯音乐可以由自然乐器(如钢琴、小提琴、吉他等等)或电声乐器演奏而成的,所以通常以音频中是否包含人声来区别该音频是否属于纯音乐。
在现有技术中,通常需要根据整曲音乐判断该音乐是否为纯音乐,有的歌曲有零散人声,但通常被认为是纯音乐,对纯音乐检测准确率不高。
发明内容
本发明实施例提供一种纯音乐检测方法、装置及存储介质,用于提高纯音乐检测的准确率。
本发明实施例提供一种纯音乐检测方法,所述方法包括:
获取待检测音频;
对所述待检测音频进行人声分离处理,得到待处理音频片段;
提取所述待处理音频片段的音频特征;
将所述音频特征输入训练后的人声检测网络模型中;
根据所述训练后的人声检测网络模型的输出结果确定所述待处理音频片段中是否包含人声;
若不包含人声,则确定所述待检测音频属于纯音乐。。
相应地,本发明实施例还提供一种纯音乐检测装置,所述装置包括:
第一获取单元,用于获取待检测音频;
处理单元,用于对所述待检测音频进行人声分离处理,得到待处理音频片段;
提取单元,用于提取所述待处理音频片段的音频特征;
输入单元,用于将所述音频特征输入训练后的人声检测网络模型中;
第一确定单元,用于根据所述训练后的人声检测网络模型的输出结果确定所述待处理音频片段中是否包含人声;
第二确定单元,用于当所述待处理音频片段中不包含人声时,确定所述待检测音频属于纯音乐。
可选的,在一些实施例中,所述装置还包括:
第二获取单元,用于获取多个音频样本,所述音频样本为已知是否为纯音乐的音频样本;
第三确定单元,用于根据所述音频样本确定所述音频样本的音频特征;
添加单元,用于将所述音频特征添加至训练样本集中;
训练单元,用于根据所述训练样本集对人声检测网络模型进行训练,得到所述训练后的人声检测网络模型。
可选的,在一些实施例中,所述第三确定单元具体用于:
对所述音频样本进行人声分离处理,得到音频片段;
提取所述音频片段的音频特征,确定所述音频特征。
可选的,在一些实施例中,所述第三确定单元还具体用于:
通过Hourglass模型对所述音频样本进行人声分离处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910398945.6/2.html,转载请声明来源钻瓜专利网。