[发明专利]一种基于变速模板的音频样例检索方法有效
申请号: | 201811619717.9 | 申请日: | 2018-12-28 |
公开(公告)号: | CN111382302B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 李超;王佩;张学帅;邹学强;刘建;徐杰;胡琦 | 申请(专利权)人: | 中国科学院声学研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G06F16/632;G06F16/61 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;王宇杨 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 变速 模板 音频 检索 方法 | ||
本发明涉及一种基于变速模板的音频样例检索方法,该方法具体包括:针对长度5秒以上的变速模板的待检音频拆分为多个短音频片段,获取各个短音频片段的二进制音频指纹序列值,查找预先建立的哈希表;查找出各个短音频片段的二进制音频指纹序列值对应的模板音频的音频指纹序列值;计算各个短音频片段和模板音频之间指纹序列差异数D和模板音频与短音频片段之间允许指纹序列差异数的阈值Reject;如果D<Reject,则认为短音频片段与模板音频相似;如果D>Reject,则认为短音频片段存在错误,并提取该短音频片段。
技术领域
本发明属于音频检索技术领域,具体涉及一种基于变速模板的音频样例检索方法。
背景技术
音频样例检索是指从音频数据库中检索出与用户提交查询样例具有相似内容的音频信息并反馈给用户。其核心内容包括两部分:特征提取和特征检索。其中,音频特征提取比较关键,只有选取了合适的音频特征,才能继续后面的检索方法设计。在大多数的音频样例检索方法中,大部分都是通过音频指纹实现的。其中,音频指纹,可以理解为音频信号的独一无二标识,是通过提取算法,针对音频提取特定特征而形成的序列。因此,一段音频指纹就是一段音频内容的概括,并且能够唯一的表达这段音频信号。在音频指纹提取方面,有很多大量的提取算法。其中Haitsma等人提出了一阶相邻能量差的方法。该方法通过对音频信号进行短时傅里叶变化,然后利用相邻音频帧的一阶能量差是否大于零来形成音频指纹,接着将音频指纹转换成32位比特关键字序列,形成哈希表并构建索引来进行样例检索。除此之外,还有很多其他科研机构提出的音频指纹算法。
在上述现有的算法中,一阶相邻能量差的方法由于指纹内容简单、容易实现、复杂度小、检索效率高等优点被广泛使用。但是,在实际应用中用户获取的音频片段容易遭受环境噪声和传输噪声的干扰,或有的应用场景中要求进行匹配的语音样例很短或者样例中噪声的存在可能会导致音频指纹间误码率超过阈值而导致无法命中。另外,由于静音帧的指纹容易出现不稳定性,在音频模板比较短时,很容易出现音频的误检和漏检。
目前,传统的检索匹配算法是采用比特误差率(Bit Error,BER),即比较两个音频片段数字音频指纹间的相似度来决定候选结果,其计算方法如下:
其中,F(n,m)和F'(n,m)分别代表查询音频和待检音频第n帧音频指纹的第m位的值,N为总帧数,M为指纹的位数,BER为预设的比特误差率,一般预设为0.35。当比对误差低于预设的门限时,则表明找到了目标音频文件。
但是,该比对方法并没有考虑到在一段音频片段中不同的指纹片段在音频中出现的错误概率并不相同。例如,在静音段中,音频指纹容易出现较高的误码率。在正常连续说话的语音段中,音频指纹则会有较低的误码率。因此,在短时音频模板匹配时,上面对所有帧差异比特(bit)数相加的方法,会导致大量的虚警存在。
发明内容
本发明的目的在于,为解决现有的检索方法存在上述缺陷,本发明提出了一种基于变速模板的音频样例检索方法,在相邻能量差音频检索系统的基础上,将长模板音频拆分成短的音频模板进行检索,有效增加了系统对变速模板的鲁棒性;克服传统音频检索在待检音频变速时性能出现明显下降的问题。
为了实现上述目的,本发明提供了一种基于变速模板的音频样例检索方法,把一段较长的音频流拆分成N个较短的音频片段,对N各较短的音频片段依次进行音频检索。由于拆分后的音频片段比较短,因此针对短音频检索时,计算各个短音频静音能量的比例来进行命中结果筛检;最后,将所有命中结果进行组合,从而有效提高算法对变速音频的精度和召回。该方法具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;国家计算机网络与信息安全管理中心,未经中国科学院声学研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811619717.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:混合动力耦合系统及车辆
- 下一篇:一种照明灯插接头