[发明专利]音频搜索方法、装置、计算机设备和计算机可读存储介质有效
申请号: | 202010707678.9 | 申请日: | 2020-07-22 |
公开(公告)号: | CN111597379B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 黄润乾;张伟彬 | 申请(专利权)人: | 深圳市声扬科技有限公司 |
主分类号: | G06F16/683 | 分类号: | G06F16/683 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 搜索 方法 装置 计算机 设备 可读 存储 介质 | ||
本申请涉及一种音频搜索方法、装置、计算机设备和存储介质。所述方法包括:获取音频片段的一级音频指纹;所述一级音频指纹包含哈希对和对应的一级哈希键,按照预设窗长对所述哈希对进行分组,得到哈希对分组;所述哈希对分组包含至少两个所述哈希对;根据所述哈希对分组中哈希对的一级哈希键,计算各所述哈希对分组分别对应的二级哈希键,获得所述音频片段的二级音频指纹;所述二级音频指纹包括各所述哈希对分组和对应的各所述二级哈希键;在二级音频指纹库中,查询与所述音频片段的二级音频指纹匹配的二级音频指纹,并输出与所述匹配的二级音频指纹对应的音频文件。采用本方法能够提高音频搜索的效率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种音频搜索方法、装置、计算机设备和计算机可读存储介质。
背景技术
目前在音频搜索时通常采用音频指纹技术,音频指纹技术是指从音频片段中提取出音频指纹后,将该音频指纹与音频库中的音频指纹进行对比,从而确定音频片段的音频信息。
然而,传统的音频指纹技术在进行音频指纹对比时,需要先筛选出候选音频指纹,然后再将音频片段的音频指纹分别与各候选音频指纹进行精准匹配,通常所筛选出的候选音频指纹数据量较大,导致采用音频指纹技术进行音频搜索的效率较低。
发明内容
基于此,有必要针对采用音频指纹技术进行音频搜索的效率低的技术问题,提供一种音频搜索方法、装置、计算机设备和计算机可读存储介质。
一种音频搜索方法,所述方法包括:
获取音频片段的一级音频指纹;所述一级音频指纹包含哈希对和对应的一级哈希键,所述哈希对为所述音频片段的两个频谱峰值点的组合;
按照预设窗长对所述哈希对进行分组,得到哈希对分组;所述哈希对分组包含至少两个所述哈希对;
根据所述哈希对分组中哈希对的一级哈希键,计算各所述哈希对分组分别对应的二级哈希键,获得所述音频片段的二级音频指纹;所述二级音频指纹包括各所述哈希对分组和对应的各所述二级哈希键;
在二级音频指纹库中,搜索与所述音频片段的二级音频指纹匹配的二级音频指纹,并输出与所述匹配的二级音频指纹对应的音频文件。
在一个实施例中,所述获取音频片段的一级音频指纹,包括:
提取所述音频片段的频谱特征,确定所述频谱特征的频谱峰值点;
根据所述频谱峰值点构建哈希对;
根据所述哈希对所对应的第一频谱峰值点的第一频率和第一时间、以及所述哈希对所对应的第二频谱峰值点的第二频率和第二时间,计算各所述哈希对所对应的一级哈希键,获得包含各所述哈希对和对应的所述一级哈希键的所述音频片段的一级音频指纹。
在一个实施例中,所述根据所述哈希对分组中哈希对的一级哈希键,计算各所述哈希对分组分别对应的二级哈希键,包括:
获取所述哈希对分组中各哈希对的一级哈希键;
将获取的所述一级哈希键代入哈希公式进行计算,得到各所述哈希对分组分别对应的二级哈希键;所述哈希公式为:
其中,为第个哈希对分组对应的二级哈希键,为第个哈希对分组包含的哈希对的个数,为第个哈希对分组中的第个哈希对的一级哈希键,为第个哈希对所对应的区分因子。
在一个实施例中,所述输出与所述匹配的二级音频指纹对应的音频文件之后,所述方法包括:
在一级音频指纹库中,查询所述音频文件的一级音频指纹;
从各所述音频文件的一级音频指纹中,查询与所述音频片段的一级音频指纹匹配的一级音频指纹,并输出与所述匹配的一级音频指纹对应的音频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010707678.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种断路器用便捷型端子罩
- 下一篇:一种基于模糊PD的频率跟踪搜索方法