[发明专利]音频检索方法、装置和存储介质有效
申请号: | 201910631515.4 | 申请日: | 2019-07-12 |
公开(公告)号: | CN110377782B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 孔令城 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G06F16/63 | 分类号: | G06F16/63;G06F16/683 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 检索 方法 装置 存储 介质 | ||
本申请实施例公开了一种音频检索方法、装置和存储介质;本申请实施例可以获取待检索音频;对待检索音频进行声谱分析,得到待检索音频对应的整体声谱;对整体声谱进行音频指纹构造,得到待检索音频的音频指纹;根据待检索音频的音频指纹进行音频检索,得到检索结果;当检索结果未满足检索停止条件时,则对待检索音频的音频指纹进行更新,并返回执行根据待检索音频的音频指纹进行音频检索的步骤;当检索结果满足检索停止条件时,则停止检索,并输出检索结果。在本申请中,可以不断地更新音频指纹并根据该音频指纹进行音频检索,使得变调和/或变速后的待检索音频也可以检索成功,由此提升了音频检索的准确率。
技术领域
本申请涉及计算机领域,具体涉及一种音频检索方法、装置和存储介质。
背景技术
音频作为一种意义非凡的媒体,包含了非常丰富的听觉特征。而音频检索是以波形声音为对象的检索,也是多媒体检索技术中的一个重要组成部分。音频检索主要是采用文本检索技术,但是这种检索方式非常局限性,它是通过人工方式输入音频的属性和描述来进行检索。
然而,目前的音频指纹技术存在着准确率低下的问题。
发明内容
本申请实施例提供一种音频检索方法、装置和存储介质,可以提升音频检索的准确率。
本申请实施例提供一种音频检索方法,包括:
获取待测音频;
对所述待测音频进行声谱分析,得到所述待测音频对应的整体声谱;
对所述整体声谱进行音频指纹构造,得到所述待测音频的音频指纹;
根据所述待测音频的音频指纹进行音频检索,得到检索结果;
当检索结果未满足停止条件时,则返回对所述整体声谱进行音频指纹构造,得到所述待测音频的音频指纹的步骤;
当检索结果满足停止条件时,则停止检索。
在一些实施例中,对所述整体声谱进行音频指纹构造,得到所述待测音频的音频指纹,包括:
确定所述整体声谱上的关键点;
对所述整体声谱上的关键点进行位置调整,得到调整后关键点;
根据所述调整后关键点进行音频指纹构造,得到所述待测音频的音频指纹。
在一些实施例中,根据所述调整后关键点进行音频指纹构造,得到所述待测音频的音频指纹,包括:
确定所述调整后关键点以及所述调整后关键点对应的目标区域;
确定所述目标区域中的其它关键点;
基于所述调整后关键点和所述目标区域中的其它关键点进行哈希计算,得到所述待测音频的音频指纹。
在一些实施例中,根据所述待测音频的音频指纹进行音频检索,得到检索结果,包括:
获取数据库,其中所述数据库中包括音频以及所述音频对应的音频指纹;
将所述数据库中音频对应的音频指纹与待测音频的音频指纹进行相似度计算,得到所述数据库中音频的相似度;
根据所述数据库中音频的相似度确定检索结果。
在一些实施例中,对所述待测音频进行声谱分析,得到所述待测音频对应的整体声谱,包括:
对所述待测音频进行时域分析,得到所述待测音频对应的整体声谱。
在一些实施例中,对所述待测音频进行声谱分析,得到所述待测音频对应的整体声谱,包括:
对所述待测音频进行时域分析,得到所述待测音频的时域图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910631515.4/2.html,转载请声明来源钻瓜专利网。