[发明专利]抵抗变调干扰的采样计数音频检索方法有效
申请号: | 202110125352.X | 申请日: | 2021-01-29 |
公开(公告)号: | CN112784099B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 姚姗姗;牛保宁;钱宇华 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G06F16/635;G06F16/638 |
代理公司: | 山西五维专利事务所(有限公司) 14105 | 代理人: | 马凤娇 |
地址: | 030006 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抵抗 变调 干扰 采样 计数 音频 检索 方法 | ||
1.一种抵抗变调干扰的采样计数音频检索方法,其特征在于,包括如下步骤:
S1,计算并保存待检索音频的频谱图,并基于频谱图提取待检索音频的第一目标音频指纹,所述第一目标音频指纹为Philips指纹;
S2,在预先建立的去边的斐波那契哈希索引表中对第一目标音频指纹进行检索,得到第一目标音频指纹的第一候选序号集;
S3,利用采样计数法对第一候选序号集进行筛选,得到第二候选序号集;
S4,通过基于阈值的固定间隔抽样匹配方法将第二候选序号集中的序号在预先建立的音频指纹库中对应的指纹与第一目标音频指纹进行匹配,根据匹配结果确定第二候选序号集中的序号在音频指纹库中对应的音频指纹是否包括第一目标音频指纹;
S5,如果第二候选序号集中的序号在音频指纹库中对应的音频指纹不包括第一目标音频指纹,则在待检索音频的频谱图上利用变频带间隔的查询指纹生成方法计算第二目标音频指纹;
S6,利用多频率尺度的查询匹配方法对第二目标音频指纹进行检索匹配,得到检索结果;
所述S5中在待检索音频的频谱图上利用变频带间隔的查询指纹生成方法计算第二目标音频指纹,包括如下步骤:
S51,在待检索音频的频谱图上取300Hz至2000Hz之间的频率,再使用自然对数划分33个对数间隔,通过如下公式(2)对待检索音频的频带间隔进行划分:
lnfb=ln300+(ln2000-ln300)×nb/33+lnC(2)
公式(2)中,nb表示第nb个频带划分点,取0到33;fb表示第nb个频带划分点的对应频率值,通过取不同的nb,即可得到34个对应的频率值fb;设定C为频率缩放因子,通过取不同的C,可计算出不同频率缩放所对应的频带划分频率;
S52,通过如下公式(3)计算采样点与频率之间的对应关系:
公式(3)中,nm表示频率f对应的第nm个幅度值点;将公式(2)得到的34个频率值fb代入公式(3)中的f,得到对应的34个幅度值点nm,通过34个幅度值点nm即可划分33个频带;Fs表示采样率;Ns表示一帧音频子指纹的采样点个数;
S53,分别累加nm到nm+1之间的幅度值之和,得到第m+1个频带的能量值E(n,m+1),利用如下公式(4)计算相邻两个频带之间的能量值的差值,再比较相邻两帧之间对应频带的能量差,得到32位音频子指纹:
公式(4)中,E(n,m)表示待检索音频第n帧第m个频带的能量值,F(n,m)表示待检索音频第n帧第m位的音频子指纹;
S54,分别计算待检索音频的所有帧的音频子指纹,得到第二目标音频指纹;
所述S6在利用多频率尺度的查询匹配方法对第二目标音频指纹进行检索匹配时,包括如下步骤:
S61,设定待检索音频的变调幅度的位移方向δ和位移个数Nδ,其中δ取0和1,0代表变调幅度缩小,1代表变调幅度放大;Nδ取1到P,代表缩放尺度,以5%为间隔递增,则位移方向δ和位移个数Nδ对应的缩放频率为(100±p×5)%,其中,p∈(1,P),当δ为0时,取-号,当为1时,取+号,将(100±p×5)%代入S51中的C,得到(100±p×5)%对应的第二目标音频指纹;
S62,在去边的斐波那契哈希索引表中对(100±p×5)%对应的第二目标音频指纹进行检索,并使用采样计数法筛选得到候选序号集;
S63,将(100±p×5)%对应的第二目标音频指纹与候选序号集中的序号在音频指纹库中对应的音频进行匹配,如果匹配未成功,则返回S61;如果匹配成功,则检索结束。
2.根据权利要求1所述的抵抗变调干扰的采样计数音频检索方法,其特征在于,所述步骤S2,在预先建立的去边的斐波那契哈希索引表中对第一目标音频指纹进行检索之前,还包括:
S21,提取所有参考音频的音频指纹,得到音频指纹数据库,所述音频指纹数据库包括每一条参考音频的序号和音频指纹,每一条参考音频的音频指纹由若干音频子指纹组成;
S22,对于音频指纹数据库中每一条参考音频的音频指纹,利用如下公式(1)计算每一个音频子指纹对应的哈希值,使用音频子指纹作为key,将该参考音频的序号加入哈希值对应的哈希桶中,得到去边的斐波那契哈希索引表;
f(key)=((key<<l)>>(l+r))×Cw(1);
公式(1)中,key是32位的0/1字符串,代表参考音频的音频子指纹;Cw由黄金分割比例导出,依据斐波那契方法,当key是32位时,Cw取2654435769;l代表左移的位数;r代表右移的位数;f(key)表示音频子指纹对应的哈希值;哈希桶的数量为232-(l+r)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110125352.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:滴液封堵结构及清洁装置
- 下一篇:喷灌喷雾组合式喷头