[发明专利]一种音频匹配方法与装置、电子设备在审
申请号: | 201710803315.3 | 申请日: | 2017-09-08 |
公开(公告)号: | CN107577773A | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 李永超;方昕;刘俊华 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L25/54 |
代理公司: | 深圳市华优知识产权代理事务所(普通合伙)44319 | 代理人: | 余薇 |
地址: | 230000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 匹配 方法 装置 电子设备 | ||
技术领域
本发明涉及语音信号处理、信息检索技术领域,尤其涉及一种音频匹配方法与装置、电子设备。
背景技术
随着信息技术和大数据产业的爆发,海量的音视频以数字的形式存储起来,基于音频内容的信息检索技术在很多场合都有了实际的应用,例如音乐原声检索、音频犯罪证据搜集、音频管控等领域;优秀的音频匹配检索技术对提高这些领域的效果和效率起着举足轻重的作用,因此也得到了学者们越来越多的研究和关注。
现有的基于音频内容的检索技术主要是针对较短的检索片段来进行的,检索耗时与检索音频的长短成线性增长关系,即时间为20秒的检索片段检索耗时一般是时间为5秒片段的4倍左右,同时由于提取的音频指纹特征密度较大,导致匹配计算和硬件存储的代价都快速增长,而这些特性直接影响了系统的检索效率和效果体验。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种音频匹配方法与装置、电子设备,以提高音频检索的效率。
为达上述目的,本发明提供的技术方案如下:
一种音频匹配方法,包括如下步骤:
步骤一,获取待匹配音频数据;
步骤二,对所述待匹配音频数据进行分割,得到多个分割后的待匹配音频片段;
步骤三,提取每段待匹配音频片段的音频指纹特征,根据提取的音频指纹特征利用预先构建的音频匹配库对每段待匹配音频片段进行音频匹配,得到每段待匹配音频片段的音频匹配结果;
步骤四,对各待匹配音频片段的匹配结果进行合并,得到所述待匹配音频数据的匹配结果。
可选地,所述音频匹配库通过如下步骤构建:
预先收集大量音频数据;
提取每段音频数据的音频指纹特征;
将每段音频数据的指纹特征进行结构化存储,构建获得所述音频匹配库。
可选地,步骤二包括:
根据所述待匹配音频数据的静音段将所述待匹配音频数据分割为多个音频片段;
依次检查每个音频片段长度是否超过预先设定阈值;
将超过预先设定阈值的音频片段按固定长度再次进行分割。
可选地,所述音频指纹特征的提取步骤包括:
确定每帧音频数据的原始候选极值点;
基于候选极值点之间的影响系数和/或基于候选极值点的密度和/或基于候选极值点之间的差分计算结果对所述原始候选极值点进行筛选,获得每帧音频数据的极值点列表;
根据每帧音频数据的极值点列表,提取每帧音频数据的指纹特征。
可选地,所述基于候选极值点之间的影响系数进行筛选的步骤包括:
依次选择当前帧音频数据的原始候选极值点作为候选中心极值点,构建以该候选中心极值点为中心的区域,获得该区域内的所有候选极值点;
分别计算所述候选中心极值点与其他候选极值点之间的影响系数;
根据影响系数以及候选极值点的频域幅度确定是否保留该候选中心极值点。
可选地,所述基于候选极值点的密度进行筛选的步骤包括:
依次选择每帧音频数据的原始候选极值点或经基于候选极值点之间的影响系数筛选后的候选极值点中的每个极值点作为当前候选极值点,计算当前候选极值点的密度;
若当前候选极值点的密度大于预先设定的阈值,则删除所述当前候选极值点,否则保留当前候选极值点。
可选地,所述基于候选极值点之间的差分计算结果进行筛选的步骤包括:
对原始候选极值点或经基于候选极值点之间的影响系数筛选后的候选极值点或经基于候选极值点的密度筛选后的候选极值点中的每个候选极值点进行差分计算,得到每个候选极值点的差分频谱值;
根据每个候选极值点的差分频谱值确定每帧音频数据的极值点列表。
可选地,所述差分计算的步骤具体为:根据当前帧前一或多帧音频数据的候选极值点及当前帧后一或多帧音频数据的候选极值点的频谱值对当前帧音频数据的候选极值点进行差分计算得到当前帧音频数据每个候选极值点差分后的差分频谱值。
可选地,所述根据每帧音频数据的极值点列表,提取每帧音频数据的指纹特征的步骤包括:
基于所述极值点列表中每个极值点构建候选区域,确定每个极值点的极值点对;
根据所述极值点列表中的每个极值点对,提取每帧音频数据的指纹特征;
将每帧音频数据的指纹特征进行合并,获得每段音频数据的音频指纹特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710803315.3/2.html,转载请声明来源钻瓜专利网。