[发明专利]音频指纹检索方法及装置有效
申请号: | 201110340094.3 | 申请日: | 2011-11-01 |
公开(公告)号: | CN103093761B | 公开(公告)日: | 2017-02-01 |
发明(设计)人: | 易立夫;张远涛 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G10L25/54 | 分类号: | G10L25/54;G06F17/30 |
代理公司: | 北京华沛德权律师事务所11302 | 代理人: | 刘杰 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 指纹 检索 方法 装置 | ||
1.一种音频指纹检索方法,其特征在于,所述方法包括:
对音频片段的音频信号进行分帧处理;
通过起始点检测算法(ODF)确定所述分帧处理所得到的各分帧中的关键帧;
得到所述关键帧的音频指纹,并根据所得到的音频指纹进行检索,得到对应所述音频片段的音频文件信息。
2.根据权利要求1所述音频指纹检索方法,其特征在于,所述通过起始点检测算法确定所述音频信号各分帧中的关键帧,包括:
对所述分帧处理后得到的各分帧进行快速傅氏变换(FFT),并提取所述各分帧的ODF特征参数,根据所述ODF特征参数确定所述各分帧中的关键帧。
3.根据权利要求2所述音频指纹检索方法,其特征在于,所述根据所述ODF特征参数确定所述各分帧中的关键帧,具体为:
将所述ODF特征参数满足预设ODF阈值条件的分帧确定为关键帧。
4.根据权利要求2或3所述音频指纹检索方法,其特征在于,所述提取所述各分帧的ODF特征参数,通过如下的任意一种或多种算法实现:
能量算法、差分相位算法、高频分量算法、改进的库尔贝克和莱伯勒散度算法、美尔倒谱系数、线谱对和加权相位差分。
5.根据权利要求1所述音频指纹检索方法,其特征在于,所述得到所述关键帧的音频指纹,具体为:
基于离散余弦变换(DCT)和最小哈希算法得到所述关键帧的音频指纹。
6.根据权利要求5所述音频指纹检索方法,其特征在于,所述基于DCT和最小哈希算法得到所述关键帧的音频指纹,包括:
对所述关键帧进行短时的DCT,并保留部分DCT系数;
将所保留的DCT系数采用二进制表示;
采用最小哈希算法将采用二进制表示的DCT系数转换为音频指纹。
7.一种音频指纹存储方法,其特征在于,所述方法包括:
对音频文件的音频信号进行分帧处理;
通过ODF确定所述音频信号各分帧中的关键帧;
得到所述关键帧的音频指纹;
将所述音频指纹与所述音频文件的信息对应保存。
8.一种音频指纹检索装置,其特征在于,所述装置包括:分帧处理单元、确定单元和检索单元,其中:
分帧处理单元,用于对音频片段的音频信号进行分帧处理;
确定单元,用于通过ODF确定所述分帧处理单元所得到的各分帧中的关键帧;
检索单元,用于得到所述确定单元所确定的关键帧的音频指纹,并根据所得到的音频指纹进行检索,得到对应所述音频片段的音频文件信息。
9.根据权利要求8所述音频指纹检索装置,其特征在于,所述确定单元,具体用于:
对所述分帧处理处理单元得到的各分帧进行FFT,并提取所述各分帧的ODF特征参数,根据所述ODF特征参数确定所述各分帧中的关键帧。
10.根据权利要求8所述音频指纹检索装置,其特征在于,
所述检索单元,还用于基于DCT和最小哈希算法得到所述关键帧的音频指纹。
11.一种音频指纹存储装置,其特征在于,所述装置包括:分帧处理单元、确定单元、存储单元,其中,
分帧处理单元,用于对音频文件的音频信号进行分帧处理;
确定单元,用于通过ODF确定所述分帧处理单元所得到各分帧中的关键帧;
存储单元,用于得到所述确定单元所确定关键帧的音频指纹,并将所述音频指纹与所述音频文件的信息对应保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110340094.3/1.html,转载请声明来源钻瓜专利网。