[发明专利]音频相似度检测方法、装置、介质和计算设备在审
申请号: | 202210002159.1 | 申请日: | 2022-01-04 |
公开(公告)号: | CN114464214A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 赵剑;刘华平;赵翔宇;黄安麒;张亦婷 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G06N3/04;G06N3/08;G10L25/03;G10L25/18;G10L25/30 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 相似 检测 方法 装置 介质 计算 设备 | ||
本公开的实施方式提供了一种音频相似度检测方法、装置、介质和计算设备。该方法包括:将待检测的第一音频和第二音频分别输入至神经网络模型,以由神经网络模型基于第一音频和第二音频分别进行特征提取;神经网络模型包括用于提取特征数据的至少一层卷积层、用于将最后一层卷积层输出的特征数据变换为预设维数的特征向量的自适应最大池化层和用于对自适应最大池化层输出的特征向量进行整合处理和降维处理的全连接层;基于由神经网络模型提取出的与第一音频对应的第一音频特征向量,以及与第二音频对应的第二音频特征向量,计算第一音频和第二音频之间的音频相似度。本公开可以提高音频相似度检测的准确率和效率。
技术领域
本公开的实施方式涉及计算机应用技术领域,更具体地,本公开的实施方式涉及一种音频相似度检测方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着互联网的普及,以及数字音频技术的发展,音乐资源的传播速度逐渐加快。音乐人通常会将自己的原唱音乐发布至互联网,这些原唱音乐通常以数字音频的形式在互联网上进行广泛传播。与此同时,针对这些原唱音乐的翻唱音乐也随之兴起。然而,在未经原唱方授权的情况下,对原唱音乐进行翻唱,通常会被视为抄袭行为,侵害了原唱方的权益。在这种情况下,为了保障原唱方的合法权益,如何检测针对原唱音乐的翻唱音乐,也就成为了亟待解决的问题。
发明内容
在本上下文中,本公开的实施方式期望提供一种音频相似度检测方法、装置、介质和计算设备。
在本公开实施方式的第一方面中,提供了一种音频相似度检测方法,所述方法包括:
获取待检测的第一音频和第二音频;
将所述第一音频和所述第二音频分别输入至训练完成的神经网络模型,以由所述神经网络模型基于所述第一音频和所述第二音频分别进行特征提取;其中,所述神经网络模型包括至少一层卷积层、自适应最大池化层和全连接层;所述至少一层卷积层用于提取特征数据;所述自适应最大池化层用于将最后一层卷积层输出的特征数据变换为预设维数的特征向量;所述全连接层用于对所述自适应最大池化层输出的特征向量进行整合处理和降维处理;
获取由所述神经网络模型提取出的与所述第一音频对应的第一音频特征向量,以及与所述第二音频对应的第二音频特征向量;
基于所述第一音频特征向量和所述第二音频特征向量,计算所述第一音频和所述第二音频之间的音频相似度。
可选地,所述神经网络模型包括至少三层卷积层;所述神经网络模型还包括用于对所述至少三层卷积层输出的特征数据分别进行归一化处理的至少三层批标准化层。
可选地,所述神经网络模型还包括用于对第一层批标准化层和第二层批标准化层输出的特征数据分别进行降维处理的两层最大池化层。
可选地,所述神经网络模型还包括用于对最后一层批标准化层输出的特征数据进一步进行特征提取的两层卷积层。
可选地,所述第一音频为原唱音乐;
所述方法还包括:
确定所述音频相似度是否大于或等于预设阈值;
如果所述音频相似度大于或等于所述阈值,则确定所述第二音频为针对所述原唱音乐的翻唱音乐。
可选地,所述神经网络模型通过如下方式完成训练:
获取若干音频样本类;其中,所述音频样本类包括若干相似的音频样本;目标音频样本类中的目标音频样本,和所述目标音频样本类中的其他任一音频样本,构成目标三元组中的正样本对;所述目标音频样本和其他任一音频样本类中的任一音频样本,构成所述目标三元组中的负样本对;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210002159.1/2.html,转载请声明来源钻瓜专利网。