[发明专利]音频指纹提取方法、装置、计算机设备和可读存储介质有效
申请号: | 202010708305.3 | 申请日: | 2020-07-22 |
公开(公告)号: | CN111737515B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 黄润乾;丁俊豪 | 申请(专利权)人: | 深圳市声扬科技有限公司 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G06F16/61 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 指纹 提取 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种音频指纹提取方法,其特征在于,所述方法包括:
对音频信号进行分帧,得到至少两个的单帧音频信号;
通过线性预测分析确定各所述单帧音频信号的共振峰;所述共振峰为对应单帧音频信号的频谱包络的峰值,用于区分不同的音素;
确定各所述共振峰在所述音频信号的频谱图中的共振峰值点;
根据所述共振峰值点中属于预设的峰值点频率区间的共振峰值点,构建共振峰哈希对;所述共振峰哈希对包含两个共振峰值点;
获取每个共振峰哈希对中共振峰值点所对应的频率和时间偏移量;
根据所述频率和所述时间偏移量,确定每个所述共振峰哈希对所对应的哈希键,得到所述音频信号的共振峰音频指纹;所述共振峰音频指纹包含各所述共振峰哈希对,每个所述共振峰哈希对分别对应有所述哈希键;所述共振峰音频指纹用于音频搜索。
2.根据权利要求1所述的方法,其特征在于,所述通过线性预测分析确定各所述单帧音频信号的共振峰,包括:
通过线性预测分析计算各所述单帧音频信号的线性预测系数;
基于所述线性预测系数,采用插值法或求根法确定各所述单帧音频信号的共振峰。
3.根据权利要求1所述的方法,其特征在于,所述根据所述共振峰值点中属于预设的峰值点频率区间的共振峰值点,构建共振峰哈希对,包括:
获取所述音频信号的音频类型;
根据所述音频类型确定所述音频信号对应的峰值点频率区间;
从所述共振峰值点中选择在所述峰值点频率区间内的目标共振峰值点;
根据各所述目标共振峰值点构建共振峰哈希对。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取与所述音频类型对应的共振峰音频指纹库;
在所述共振峰音频指纹库中,搜索与所述音频信号的共振峰音频指纹匹配的目标共振峰音频指纹。
5.根据权利要求4所述的方法,其特征在于,所述在所述共振峰音频指纹库中,搜索与所述音频信号的共振峰音频指纹匹配的目标共振峰音频指纹,包括:
从所述共振峰音频指纹库中获取模板共振峰音频指纹;所述模板共振峰音频指纹包含模板共振峰哈希对和对应的模板哈希键;
从所述模板哈希键中筛选与所述共振峰音频指纹的哈希键相同的目标模板哈希键;
获取各所述目标模板哈希键对应的目标模板共振峰哈希对的第一时间偏移量,以及与所述目标模板哈希键相同的所述哈希键对应的共振峰哈希对的第二时间偏移量;
计算各所述第一时间偏移量与所述第二时间偏移量的差,得到多个时间差;
统计所述多个时间差分别对应的数量,根据各所述数量确定所述模板共振峰音频指纹为与所述音频信号的共振峰音频指纹的相似度;
若所述相似度满足匹配条件,则确定所述模板共振峰音频指纹为与所述音频信号的共振峰音频指纹匹配的目标共振峰音频指纹。
6.根据权利要求4所述的方法,其特征在于,所述在所述共振峰音频指纹库中,搜索与所述音频信号的共振峰音频指纹匹配的目标共振峰音频指纹之前,所述方法还包括:
获取各音频文件和对应的音频类型;
根据各所述音频类型确定各所述音频文件对应的峰值点频率区间;
通过线性预测分析确定各所述音频文件的共振峰;
根据各所述音频文件对应的峰值点频率区间和各所述音频文件的共振峰构建各所述音频文件的共振峰音频指纹;
将各所述音频文件的共振峰音频指纹作为模板音频指纹生成与各所述音频类型对应的音频指纹库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010708305.3/1.html,转载请声明来源钻瓜专利网。