[发明专利]一种音频指纹提取系统在审

专利信息
申请号: 201910558046.8 申请日: 2019-06-26
公开(公告)号: CN110289012A 公开(公告)日: 2019-09-27
发明(设计)人: 任云;蔡荣华 申请(专利权)人: 南京信安融慧网络技术有限公司
主分类号: G10L25/03 分类号: G10L25/03;G10L25/18;G10L25/45;G10L25/54
代理公司: 南京泰普专利代理事务所(普通合伙) 32360 代理人: 张磊
地址: 211100 江苏省南京市将军大道迎翠*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据处理模块 音频指纹提取 选取模块 特征点 指纹生成模块 音频指纹 指纹 预处理 音频PCM数据 输出 检索效率 输出模块 输出音频 信息提取 指纹信息 输入端 输入段 准确率 算法 信息量
【说明书】:

发明公开一种音频指纹提取系统,属于信息提取的技术领域。包括:数据处理模块、特征点选取模块和指纹生成模块;所述数据处理模块用于对音频PCM数据的预处理,所述特征点选取模块的输入段与所述数据处理模块的输出端相连接,所述指纹生成模块的输入端与所述特征点选取模块的输出端相连接,所述指纹输出模块用于输出音频指纹信息。本发明提供的音频指纹提取算法,丰富了音频指纹的信息量,减少了指纹的碰撞率,提高了音频指纹的准确率,加快了检索效率。

技术领域

本发明属于信息提取的技术领域,特别是涉及一种音频指纹提取系统。

背景技术

随着网络技术和多媒体技术的发展,数字形式的多媒体资源越来越容易获取,多媒体的发行也变得越来越方便,多媒体数据正呈现爆炸式增长。在此背景下,如何管理多媒体资源,实现对其自动标注、分类和检索等,已逐渐成为研究热点。在各种多媒体资源中,音频资源以其独特的形式和用途受到了研究者的特殊关注。

目前对于音频资源的检索识别有了很多的成果,主要是基于时域分析或者频域分析或者倒谱域分析三个方面。大数据时代的到来对于计算性能有更高的要求,音频内容特征的鲁棒性也有了更高的需求。而频域分析或者倒谱域分析对于噪声的干扰抵抗更强。

在过去的十几年中,很多研究人员提出了性能良好的音频指纹提取算法,其中最经典的是,飞利浦鲁棒哈希算法(Philips Robust Hash,PRH)和Shazam算法。后续研究人员多数都是在此两种算法的基础上进行不断地完善和改进。PRH算法的主要特点是从音频的整个频谱中提取全局信息,信息量大,特征的区分性强,但是鲁棒性不高;Shazam算法的主要特点是从音频的频谱中提取典型的稳定的特征点,并使用特征点对构建音频指纹,音频指纹比较鲁棒,但是提取的特征点数目相对比较少,区分性比较差,碰撞率比较高。

发明内容

本发明的目的是提供一种音频检索中的音频指纹提取算法,用以解决海量音频检索中指纹碰撞率高的问题。

本发明提供一种音频指纹提取系统,数据处理模块、特征点选取模块和指纹生成模块;所述数据处理模块用于对音频PCM数据的预处理,所述特征点选取模块的输入段与所述数据处理模块的输出端相连接,所述指纹生成模块的输入端与所述特征点选取模块的输出端相连接,所述指纹输出模块用于输出音频指纹信息。

在进一步的实施例中,所述数据处理模块的处理具体包括以下步骤:

步骤101、预加重:将采集得到音频单通道PCM编码样本数据,采样率为8000Hz,精度为16bit,对其进行预加重,循环从最后一个样本点向前执行FIR预加重滤波函数,第一个样本不变,即变换后的数据为当前样本值-0.97*前一个样本值,数据从16bit整型转为double浮点型;

所述FIR预加重滤波函数如下:

y[n]=x[n]-α*x[n-1],其中ɑ是预加重系数,一般取0.97,n是样本点索引,n>=1;

步骤102、分帧:采用连续交叠分段法进行分帧,此处帧长取512即512个采样点为一帧,帧移和帧长的比值一般为(0,0.5],这里取0.5即帧移为256;对于预加重后的样本数据,每隔256个样本点取512个采样点为一帧,当前帧数计数自增加1;

步骤103、加窗:取一帧,使用汉明窗进行加窗,循环使用汉明窗函数值与帧内每个样本值相乘,n和N由前面样本点分帧时计算得到,

所述汉明窗函数如下:

其中N是帧长,n是帧内该样本点的索引[0,N-1];

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信安融慧网络技术有限公司,未经南京信安融慧网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910558046.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top