[发明专利]音频指纹提取方法、装置、计算机设备和可读存储介质有效
申请号: | 202010708305.3 | 申请日: | 2020-07-22 |
公开(公告)号: | CN111737515B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 黄润乾;丁俊豪 | 申请(专利权)人: | 深圳市声扬科技有限公司 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G06F16/61 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 指纹 提取 方法 装置 计算机 设备 可读 存储 介质 | ||
本申请涉及一种音频指纹提取方法、装置、计算机设备和存储介质。所述方法包括:对音频信号进行分帧,得到至少两个的单帧音频信号;通过线性预测分析确定各所述单帧音频信号的共振峰;确定各所述共振峰在所述音频信号的频谱图中的共振峰值点;根据各所述共振峰值点构建共振峰哈希对;所述共振峰哈希对包含两个共振峰值点;获取每个共振峰哈希对中共振峰值点所对应的频率和时间偏移量;根据所述频率和所述时间偏移量,确定每个所述共振峰哈希对所对应的哈希键,得到所述音频信号的共振峰音频指纹;所述共振峰音频指纹包含各所述共振峰哈希对,每个所述共振峰哈希对分别对应有所述哈希键。采用本方法得到的共振峰音频指纹能够更好地表征音频信号。
技术领域
本申请涉及计算机技术领域,特别是涉及一种音频指纹提取方法、装置、计算机设备和可读存储介质。
背景技术
目前在音频搜索时通常采用音频指纹技术,音频指纹技术是指从音频片段中提取出音频指纹后,将该音频指纹与音频库中的音频指纹进行对比,从而确定音频片段的音频信息。
然而,传统的音频指纹提取方法比较适用于具有韵律、节奏的音乐数据上,而针对随机性比较强的对话、会议等日常语音数据,采用传统的音频指纹提取方法所提取的音频指纹往往准确率较低。
发明内容
基于此,有必要针对日常语音数据的音频指纹提取准确率低的技术问题,提供一种音频指纹提取方法、装置、计算机设备和可读存储介质。
一种音频指纹提取方法,所述方法包括:
对音频信号进行分帧,得到至少两个的单帧音频信号;
通过线性预测分析确定各所述单帧音频信号的共振峰;
确定各所述共振峰在所述音频信号的频谱图中的共振峰值点;
根据各所述共振峰值点构建共振峰哈希对;所述共振峰哈希对包含两个共振峰值点;
获取每个共振峰哈希对中共振峰值点所对应的频率和时间偏移量;
根据所述频率和所述时间偏移量,确定每个所述共振峰哈希对所对应的哈希键,得到所述音频信号的共振峰音频指纹;所述共振峰音频指纹包含各所述共振峰哈希对,每个所述共振峰哈希对分别对应有所述哈希键。
在一个实施例中,所述通过线性预测分析确定各所述单帧音频信号的共振峰,包括:
通过线性预测分析计算各所述单帧音频信号的线性预测系数;
基于所述线性预测系数,采用插值法或求根法确定各所述单帧音频信号的共振峰。
在一个实施例中,所述根据各所述共振峰值点构建共振峰哈希对,包括:
获取所述音频信号的音频类型;
根据所述音频类型确定所述音频信号对应的峰值点频率区间;
从所述共振峰值点中选择在所述峰值点频率区间内的目标共振峰值点;
根据各所述目标共振峰值点构建共振峰哈希对。
在一个实施例中,所述方法还包括:
获取与所述音频类型对应的共振峰音频指纹库;
在所述共振峰音频指纹库中,搜索与所述音频信号的共振峰音频指纹匹配的目标共振峰音频指纹。
在一个实施例中,所述在所述共振峰音频指纹库中,搜索与所述音频信号的共振峰音频指纹匹配的目标共振峰音频指纹,包括:
从所述共振峰音频指纹库中获取模板共振峰音频指纹;所述模板共振峰音频指纹包含模板共振峰哈希对和对应的模板哈希键;
从所述模板哈希键中筛选与所述共振峰音频指纹的哈希键相同的目标模板哈希键;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010708305.3/2.html,转载请声明来源钻瓜专利网。