[发明专利]一种固定音频检索方法有效
申请号: | 201110028979.X | 申请日: | 2011-01-27 |
公开(公告)号: | CN102622353A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 刘赵杰 | 申请(专利权)人: | 天脉聚源(北京)传媒科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100007 北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 固定 音频 检索 方法 | ||
技术领域
本发明涉及多媒体技术领域,尤其涉及一种固定音频检索方法。
背景技术
伴随信息时代的发展、多媒体资料的增多,日益呈现海量化的规模。当人们在浏览和理解这些内容时,作为多媒体数据中标志性部分的音频,为人们的感知提供了重要的线索。为了从这些资料获取感兴趣的内容,需要进行信息提取和检索查询,其中固定音频检索就是一种比较实用的技术。固定音频检索是指在待检音频中检测和定位与给定查询音频同源的音频片段,它是多媒体检索中的基本问题之一。固定音频检测技术涉及模式识别、音频信号处理,语音处理等多项技术。该项技术具有非常广泛的应用前景,可以广泛应用于节目、音乐、广告等的检索和定位,版权保护和评价音频的压缩质量及某些具有军事用途的音频信号解码与监听等方面。随着技术的不断成熟以及计算机硬件水平的发展,可以预见,在不久的将来,该技术将迅速走进大众的生活,它将改变人们学习、工作和生活娱乐的方式,从而产生巨大的经济效益和社会效益。
在音频检索领域,基于音频指纹检索系统是常用的一种系统。它主要通过信号处理的方法,将音频中每隔一个固定时间的音频信号转为个固定字节大小的音频指纹,用这种方法将音频数据转化成一个音频指纹数据。然后系统对所有音频指纹数据建立索引表,从而对音频数据建立了快速检索。
基于音频指纹检索系统在音频数据比较少的情况下,可以将所有的指纹数据调入内存中,进行索引后,可方便地进行快速检索。在实际情况下,音频数据的量很大,而且数量还在不断的增长,同时固定音频检索系统,当查询的模板数比较多时,或者查询的模板长度比较长时,计算复杂度就会高,效率就会直线下降,面对海量查询库时更明显。固定音频检索查询库在建立时没有考虑到数据的特性,导致查询库本身很大,同时没有考虑检索目标数据特性,当检索目标较长时,检索时间会变得很长。
发明内容
本发明的目的在于提出一种固定音频检索方法,能够极大地减少计算复杂度,提高音频数据查询的效率。
为达此目的,本发明采用以下技术方案:
一种固定音频检索方法,包括以下步骤:
A、通过静音段对音频数据进行分段,形成非静音的音频数据检测段;
B、对音频数据检测段进行谐波检测,并对音频数据检测段进行分类,形成音频数据指纹段分类索引;
C、将音频数据检测段分成固定长度的音频数据指纹段,根据信息量对音频数据指纹段进行标识分类,形成音频数据指纹段索引;
D、对每个音频数据指纹段提取音频数据指纹特征,建立音频数据指纹索引;
E、通过静音段对待检索音频数据进行分段,形成非静音的待检索音频数据检测段,从中选取不少于一段时间最长的待检索音频数据检测段作为查询音频数据检测段;
F、对查询音频数据检测段进行谐波检测,确定查询音频数据检测段的类别,通过音频指纹段分类索引,找到查询音频数据检测段对应的音频数据检测段;
G、将查询音频数据检测段分成固定长度的查询音频数据指纹段,逐段评估查询音频数据指纹段的信息量,选取信息量超过预设阈值的最长连续查询音频数据指纹段作为查询音频数据段;
H、在所述的对应的音频数据检测段中,通过音频数据指纹段索引,获得查询音频数据段在所述对应的音频数据检测段中的候选位置;
I、通过音频数据指纹索引,将查询音频数据段与所述对应的音频数据检测段中的候选位置进行匹配,获得音频检索结果。
步骤B中,对包含谐波结构的音频数据检测段分成语音段或者音乐段,对不包含谐波结构的音频数据检测段分成噪音段或者无效音段。
步骤F中,对包含谐波结构的查询音频数据检测段分成语音段或者音乐段,对不包含谐波结构的查询音频数据检测段分成噪音段或者无效音段。
步骤A中,通过音频数据当前段的能量与总体能量的比值,判断是否静音段还是有效声音段。
步骤E中,通过待检索音频数据当前段的能量与总体能量的比值,判断是否静音段还是有效声音段。
采用了本发明的技术方案,通过对音频数据库进行高质量索引,查询时采用粗细结合分级别查询方式,可以大大减少计算复杂度,提高查询效率。
附图说明
图1是本发明具体实施方式中固定音频检索流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天脉聚源(北京)传媒科技有限公司,未经天脉聚源(北京)传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110028979.X/2.html,转载请声明来源钻瓜专利网。