[发明专利]假唱检测方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202110766671.9 | 申请日: | 2021-07-07 |
公开(公告)号: | CN113470693A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 高月洁;郑博;刘华平;曹偲 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/51;G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 假唱 检测 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种假唱检测方法,其特征在于,应用于服务端,包括:
确定待检测音频对应的待检测音频特征;所述待检测音频特征通过对待检测音频指纹进行解码处理得到;
确定所述待检测音频对应的参考音频的参考音频特征;所述参考音频特征通过对参考音频指纹进行解码处理得到;
对所述待检测音频特征与所述参考音频特征进行相似度计算,以得到音色相似度;
将所述音色相似度与相似度阈值进行对比,根据对比结果确定所述待检测音频的检测结果;其中,所述待检测音频指纹与所述参考音频指纹是由客户端分别对所述待检测音频与所述参考音频进行音频特征提取与编码处理所得到的。
2.根据权利要求1所述的方法,其特征在于,所述待检测音频特征包括待检测梅尔谱,所述参考音频特征包括参考梅尔谱;
所述对所述待检测音频特征与所述参考音频特征进行相似度计算,以得到音色相似度,包括:
获取预先构建的音频特征提取模型;所述音频特征提取模型基于包含多个表演者标签的测试音频训练得到;
将所述待检测梅尔谱与所述参考梅尔谱输入至所述音频特征提取模型,以分别得到对应的待检测特征向量与参考特征向量;
计算所述待检测特征向量与所述参考特征向量之间的向量距离,以得到所述音色相似度。
3.根据权利要求2所述的方法,其特征在于,所述音频特征提取模型包括多个第一卷积层、与各所述第一卷积层对应的池化层以及第二卷积层;
所述将所述待检测梅尔谱与所述参考梅尔谱输入至所述音频特征提取模型,以分别得到对应的待检测特征向量与参考特征向量,包括:
由各所述第一卷积层与各所述池化层对所述待检测梅尔谱进行特征提取,得到初始待检测特征;
由所述第二卷积层对所述初始待检测特征进行卷积处理,得到所述待检测特征向量;
由各所述第一卷积层与各所述池化层对所述参考梅尔谱进行特征提取,得到初始参考特征;
由所述第二卷积层对所述初始参考特征进行卷积处理,得到所述参考特征向量。
4.一种假唱检测方法,其特征在于,应用于客户端,包括:
获取待检测音频,并确定与所述待检测音频对应的参考音频;所述待检测音频基于实时获取的待检测实时音频得到;
分别对所述待检测音频与所述参考音频进行音频特征提取,以得到对应的待检测音频特征与参考音频特征;
对所述待检测音频特征进行编码处理,以得到对应的待检测音频指纹;
对所述参考音频特征进行编码处理,以得到对应的参考音频指纹;
将所述待检测音频指纹与所述参考音频指纹发送至服务端,以由服务端对所述待检测音频指纹与所述参考音频指纹进行解码处理,分别得到对应的所述待检测音频特征与所述参考音频特征;对所述待检测音频特征与所述参考音频特征进行相似度计算,得到音色相似度,以根据所述音色相似度确定所述待检测音频的检测结果。
5.根据权利要求4所述的方法,其特征在于,所述待检测音频特征包括待检测梅尔谱,所述参考音频特征包括参考梅尔谱;
所述分别对所述待检测音频与所述参考音频进行音频特征提取,以得到对应的待检测音频特征与参考音频特征,包括:
确定音频采样频率以及音频提取窗函数;
根据所述音频采样频率与所述音频提取窗函数分别对所述待检测音频与所述参考音频进行频谱计算,以得到对应的待检测音频频谱与参考音频频谱;
获取预先配置的频带值,采用所述频带值并通过音频滤波器对所述待检测音频频谱进行处理,得到所述待检测梅尔谱;
采用所述频带值并通过所述音频滤波器对所述参考音频频谱进行处理,得到所述参考梅尔谱。
6.根据权利要求5所述的方法,其特征在于,所述对所述待检测音频特征进行编码处理,以得到对应的待检测音频指纹,包括:
将所述待检测梅尔谱进行数据展开处理,生成对应的初始待检测特征数组;所述初始待检测特征数组包含第一数据格式的数据;
对所述初始待检测特征数组的数据由所述第一数据格式转换为第二数据格式,得到中间待检测特征数组;
对所述中间待检测特征数组进行编码处理,以得到所述待检测音频指纹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110766671.9/1.html,转载请声明来源钻瓜专利网。