[发明专利]音频文件检索方法及装置在审
申请号: | 201711173138.1 | 申请日: | 2017-11-22 |
公开(公告)号: | CN107918663A | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | 张菁芸;王辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 刘映东 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频文件 检索 方法 装置 | ||
1.一种音频文件检索方法,其特征在于,所述方法包括:
实时采集待检索的音频片段;
获取所述音频片段的多个音频帧中时序相邻的每两个音频帧对应子带的频谱质心的差值,得到多个差值;
基于所述多个差值和预设差值阈值,得到所述两个音频帧对应的音频指纹,所述音频指纹的每一位由所述位对应的差值是否满足差值预设条件确定;
基于所述多个音频帧的音频指纹在音频文件库中进行检索,得到与所述音频片段匹配的目标音频文件。
2.根据权利要求1所述的方法,其特征在于,所述获取所述音频片段的多个音频帧中时序相邻的每两个音频帧对应子带的频谱质心的差值,得到多个差值之前,所述方法还包括:
对于所述音频片段的每个音频帧的每个子带,基于所述音频帧的频谱中所述子带的每个频率的幅值,获取所述子带的原始频谱质心;
基于所述子带的下限频率和上限频率,对所述原始频谱质心进行归一化,得到所述子带的频谱质心。
3.根据权利要求1所述的方法,其特征在于,所述获取所述音频片段的多个音频帧中时序相邻的每两个音频帧对应子带的频谱质心的差值,得到多个差值之前,所述方法还包括:
获取音频片段的频谱中的至少一个能量峰值;
基于所述至少一个能量峰值,从所述音频片段中选取至少一个种子片段,每个种子片段是指位于能量峰值左右预设帧数内的至少一个音频帧;
针对所述至少一个种子片段中的每个种子片段中的每个音频帧,对所述音频帧进行划分,得到所述音频帧对应的多个子带。
4.根据权利要求1所述的方法,其特征在于,所述获取所述音频片段的多个音频帧中时序相邻的每两个音频帧对应子带的频谱质心的差值,得到多个差值之前,所述方法还包括:
对于音频片段的多个候选音频帧中的每个候选音频帧,基于所述候选音频帧的频谱,获取所述候选音频帧的能量过零率;
基于所述候选音频帧的频谱,获取所述候选音频帧的多个子带的能量比;
基于所述候选音频帧的能量过零率以及多个能量比,从所述多个候选音频帧中筛选出不符合能量预设条件的多个音频帧;
其中,所述能量预设条件为:能量过零率低于预设过零率阈值,且所述多个子带的能量比之间的相似度符合要求。
5.根据权利要求1所述的方法,其特征在于,所述基于所述多个音频帧的音频指纹在音频文件库中进行检索,得到与所述音频片段匹配的目标音频文件,包括:
记录所述音频文件库中的至少一个指定音频文件的命中次数,所述指定音频文件是指命中任一个音频指纹的音频文件;
对于所述至少一个指定音频文件中的每个指定音频文件,当所述指定音频文件的命中次数大于预设命中次数阈值时,计算所述指定音频文件的误码率;
基于每个指定音频文件的误码率,从所述至少一个指定音频文件中选取所述目标音频文件。
6.根据权利要求1所述的方法,其特征在于,所述基于所述多个差值和预设阈值,得到所述两个音频帧对应的音频指纹,包括:
对于所述多个差值中的每个差值,当所述差值大于所述预设差值阈值时,将音频指纹中所述差值对应的位取1;
当所述差值不大于所述预设差值阈值时,将音频指纹中所述差值对应的位取0。
7.根据权利要求1所述的方法,其特征在于,所述音频文件库通过以下过程建立:
对于任一音频文件的多个音频帧中的每个音频帧,基于所述音频帧的频谱,获取所述音频帧的多个子带的频谱质心;
对于所述多个音频帧中时序相邻的每两个音频帧,计算所述两个音频帧的对应子带的频谱质心的差值,得到多个差值;
基于所述多个差值和预设差值阈值,得到所述两个音频帧对应的音频指纹,所述音频指纹的每一位由所述位对应的差值是否满足差值预设条件确定;
将得到的至少一个音频指纹与所述音频文件对应存储于所述音频文件库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司,未经腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711173138.1/1.html,转载请声明来源钻瓜专利网。