[发明专利]一种检测音频是否是纯音乐音频的方法和装置有效
申请号: | 201810122585.2 | 申请日: | 2018-02-07 |
公开(公告)号: | CN108320756B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 刘翠 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/78 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 音频 是否 纯音乐 方法 装置 | ||
1.一种检测音频是否是纯音乐音频的方法,其特征在于,所述方法包括:
在目标音频的N个预设位置处,分别截取音频段,得到N个待检测音频段,其中,N为预设正整数;
根据预先存储的纯音乐基准音频特征和歌曲基准音频特征,分别确定每个待检测音频段对应的可能性值,其中,所述可能性值用于指示对应的待检测音频段是纯音乐音频的可能性或不是纯音乐音频的可能性,所述纯音乐基准音频特征是对在不同类别的纯音乐音频的多个预设位置处截取的音频段进行音频特征提取获得的,所述歌曲基准音频特征是对在不同类别的歌曲音频的多个预设位置处截取的音频段进行音频特征提取获得的;
基于所述每个待检测音频段对应的可能性值,确定所述目标音频是否是纯音乐音频;
所述基于所述每个待检测音频段对应的可能性值,确定所述目标音频是否是纯音乐音频,包括:
当所述每个待检测音频段对应的可能性值均大于或等于预设的第一阈值时,确定所述目标音频是纯音乐音频;
当所述每个待检测音频段对应的可能性值均大于或等于预设的第二阈值,且至少有一个可能性值小于所述第一阈值时,获取所述目标音频的名称和所述目标音频对应的词条信息中的音频类别,如果所述目标音频的名称中不包含伴奏的字符,且所述目标音频对应的词条信息中的音频类别不包括伴奏类别,确定所述目标音频是纯音乐音频;其中,所述第二阈值小于所述第一阈值;
当所述每个待检测音频段对应的可能性值均大于或等于预设的第二阈值,且至少有一个可能性值小于所述第一阈值,且所述目标音频的名称中包含伴奏的字符,以及所述目标音频对应的词条信息中的音频类别包括伴奏类别时,或者,当所述可能性值中至少存在一个可能性值小于所述第二阈值时,确定所述目标音频不是纯音乐音频;
所述根据预先存储的纯音乐基准音频特征和歌曲基准音频特征,分别确定每个待检测音频段对应的可能性值,包括:
提取每个待检测音频段的音频特征;
对于所述每个待检测音频段,确定所述待检测音频段的音频特征与预先存储的M个纯音乐基准音频特征中每个纯音乐基准音频特征的第一相似度,并确定所述待检测音频段的音频特征与预先存储的M个歌曲基准音频特征中每个歌曲基准音频特征的第二相似度;
在M个所述第一相似度与M个第二相似度中,确定最大的Q个相似度,在所述Q个相似度中,将与纯音乐基准音频对应的相似度的数目,确定为每个待检测音频段对应的可能性值,其中,Q为预设正整数;
所述提取每个待检测音频段的音频特征之前,还包括:
获取所述M个纯音乐基准音频特征和所述M个歌曲基准音频特征对应的第一概率密度函数;
所述提取每个待检测音频段的音频特征之后,还包括:
确定每个待检测音频段对应的第二概率密度函数;
对于所述每个待检测音频段,基于所述M个纯音乐基准音频特征、所述M个歌曲基准音频特征、所述第一概率密度函数、所述待检测音频段的音频特征以及对应的第二概率密度函数,确定所述待检测音频段的音频特征与所述M个纯音乐基准音频特征中每个纯音乐基准音频特征的第一相似度,并确定所述待检测音频段的音频特征与所述M个歌曲基准音频特征中每个歌曲基准音频特征的第二相似度,
所述第一概率密度函数为F(X)=W1*f1(X)+W2*f2(X)+W3*f3(X)+...WR*fR(X),
其中,W1、W2、W3…WR分别为系数,f1(X)、f2(X)、f3(X)…fR(X)分别为联合概率密度函数,R为经验值,R的取值范围为任意正整数;
所述联合概率密度函数为
其中,n=32,i=1、2、…R,μi为期望,σi2为方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810122585.2/1.html,转载请声明来源钻瓜专利网。